策略分享

[实盘经验贴] 高收益策略 vs 中等收益策略 怎么选?

由woshisilvio创建,最终由woshisilvio 被浏览 416 用户

作者:woshisilvio

{w:100}{w:100}

AI量化的玄学- 第一章

如何更有效率的对抗过拟合? 对抗随机性?---

答案:给你个表情自己体会。

https://bigquant.com/wiki/doc/gaishuai-VEmyCgB5uz

{w:100}{w:100}

我手里有很多回测看起来非常爆炸 也非常犀利的策略,但是应用到实盘上,我心里面还是有点虚,我不知道怎么选?

怎么办?

答案是:都不选。选看起来比较正常的。

https://bigquant.com/live/shared/strategy?id=80306



是应该选回测 高收益的用来实盘? 还是 选回测收益一般的用来实盘?

答案:我不知道。反正我都买 就赚钱了。

皮一下,本文针对超短周期的模型,进行了一些分析和研究。下面把研究的记录扒拉一下。

                                                到底**,高收益策略 vs 中等收益策略 vs 低收益策略**  孰强孰弱?


针对这个问题,我总结了一些自己这段时间 在研究模型结构 中 发现的几个点。

一.过度择时的模型的表现。-实盘不佳

二.短周期训练模型的表现。-实盘不佳

三.中长周期训练模型的表现 -实盘尚可

四.中长周期训练模型+无风控无择时的表现 -实盘不错

五.长周期训练模型+无风控无择时的表现 -实盘相当不错

六.长周期训练模型+无风控带择时的表现 -实盘还算不错

七.长周期训练模型+有风控带择时的表现 -实盘还算不错

八.因子数量20以上的模型 -实盘效果一般

九.因子数量5-10左右的模型 -实盘效果尚可

十.因子数量5一下的模型 -实盘效果尚可

结合上述研究记录,我说一下我个人的观点:

==①尽量选择 在相同绩效下的模型, 因子数量少,优先选择 选股数量多,且alpha稳定的模型。==

==②尽量选择 不过度择时,且训练周期较长的模型。==

==③尽量选择 不需要风控,也不需要择时 效果更好的模型。==

==④尽量选择 选股收益效应集中在头部或者尾部(比如score因子值大或者小的一端),选股方向较为显著的模型。==

==⑤尽量选择 高收益的模型。低收益的,dog都不要。。。。懂的都懂==


接下来是研究记录:

实测了 许多模型 在样本外数据(实盘中)绩效, 结合一些 朋友常用的优化模型手段,发现几个比较有趣的现象。

1. 过度择时(比如相当苛刻的选股条件,回测数据上就一条横线 过去的那种) 以及 在预测集前过滤数据 再传入模型预测模块 进行跑回测的。

结果: 实盘有效时间短(一般1-3个月以内打回原形),失效时间非常快。偶然性极大,不稳定(模拟实盘如下图)

{w:100}{w:100}2. 训练集时间短(不足1年 或者3年以内的)又或者训练数据过少(1W条以下的)

{w:100}{w:100}

结果: 实盘有效时间不长(一般3个月-半年左右以内打回原形),容易受到市场风格影响,市场风格转变后容易遭受市场反转的回撤。

这里就不得不提一个滚动训练的操作,在笔者看来,滚动训练其实是一个更复杂的环节。

固定时间 周期 去更新模型,这种操作其实更类似于给模型叠加了一个不稳定态buff。

因为单靠固定时间周期去更新我们的训练数据 对模型重新训练,我们甚至没办法确定 新训练出来的模型,

能否比原来的模型更优秀, 有可能 新加入的数据 会使得模型坍塌,绩效甚至不如原来的模型。


3.训练时间(3-5年以上) 甚至10年其长期数据的,对比短周期模型的表现,确实数据集长一点的训练,可以让模型更充分的挖掘数据中的规律。

{w:100}{w:100}

结果: 实盘有效时间较长(系统的鲁棒性较好),能吃到市场上涨趋势中的大部分收益。比较能发挥多因子选股原有的效能。

4.训练时间(5年以上)不择时 vx 带择时

对比下图 3个回测,一般人看到的 肯定会觉得高收益的策略 效果更好, 但是实际上在实盘中发现,

反而是回测较为一般的第1个和第2个策略的表现更好,这就有点耐人寻味了~

{w:100}{w:100}

哪怕把选股数量提升到5-10只股票之后也发现,

不管横向看还是纵向去看,无风控不择时的情况 也比有风控 或者带择时的要好。


1.有风控不择时{w:100}{w:100} 2.无风控不择时{w:100}{w:100}


3.有风控有择时{w:100}{w:100}


5.因子数量多的模型,看起来更稳定。但是更容易过拟合。

因子数量多的情况下,线性模型和决策树模型反而不如 DL -alpha 深度学习模型有效。

6.因子数量少的模型,效果反而更好。

也许是算力问题,和策略容量问题,超短周期中,市场的风格和选股偏好一般都偏向某一类因子,而且从stockranker的特征重要度 我们也能发现,基本上,选股的alpha都是头部几个因子贡献的,特征重要度低的那些因子 可以说都是陪衬。

实际上,可能我们的模型并不需要这么多的特征去学习,太多因子反而会干扰我们模型学习的进程。

后续更新待续ing……


\

标签

AI量化过拟合实盘
评论
  • 怎样算是过度择时?比如几个条件筛选条件?
  • 有道理,我一般选择10年训练数据
  • 有道理,我一般选择10年训练数据
  • 真正的大神,感谢无私分享
{link}