[实盘经验贴] 高收益策略 vs 中等收益策略 怎么选?
由woshisilvio创建,最终由woshisilvio 被浏览 416 用户
作者:woshisilvio
AI量化的玄学- 第一章
如何更有效率的对抗过拟合? 对抗随机性?---
答案:给你个表情自己体会。
https://bigquant.com/wiki/doc/gaishuai-VEmyCgB5uz
我手里有很多回测看起来非常爆炸 也非常犀利的策略,但是应用到实盘上,我心里面还是有点虚,我不知道怎么选?
怎么办?
答案是:都不选。选看起来比较正常的。
https://bigquant.com/live/shared/strategy?id=80306
是应该选回测 高收益的用来实盘? 还是 选回测收益一般的用来实盘?
答案:我不知道。反正我都买 就赚钱了。
皮一下,本文针对超短周期的模型,进行了一些分析和研究。下面把研究的记录扒拉一下。
到底**,高收益策略 vs 中等收益策略 vs 低收益策略** 孰强孰弱?
针对这个问题,我总结了一些自己这段时间 在研究模型结构 中 发现的几个点。
一.过度择时的模型的表现。-实盘不佳
二.短周期训练模型的表现。-实盘不佳
三.中长周期训练模型的表现 -实盘尚可
四.中长周期训练模型+无风控无择时的表现 -实盘不错
五.长周期训练模型+无风控无择时的表现 -实盘相当不错
六.长周期训练模型+无风控带择时的表现 -实盘还算不错
七.长周期训练模型+有风控带择时的表现 -实盘还算不错
八.因子数量20以上的模型 -实盘效果一般
九.因子数量5-10左右的模型 -实盘效果尚可
十.因子数量5一下的模型 -实盘效果尚可
结合上述研究记录,我说一下我个人的观点:
==①尽量选择 在相同绩效下的模型, 因子数量少,优先选择 选股数量多,且alpha稳定的模型。==
==②尽量选择 不过度择时,且训练周期较长的模型。==
==③尽量选择 不需要风控,也不需要择时 效果更好的模型。==
==④尽量选择 选股收益效应集中在头部或者尾部(比如score因子值大或者小的一端),选股方向较为显著的模型。==
==⑤尽量选择 高收益的模型。低收益的,dog都不要。。。。懂的都懂==
接下来是研究记录:
实测了 许多模型 在样本外数据(实盘中)绩效, 结合一些 朋友常用的优化模型手段,发现几个比较有趣的现象。
1. 过度择时(比如相当苛刻的选股条件,回测数据上就一条横线 过去的那种) 以及 在预测集前过滤数据 再传入模型预测模块 进行跑回测的。
结果: 实盘有效时间短(一般1-3个月以内打回原形),失效时间非常快。偶然性极大,不稳定(模拟实盘如下图)
2. 训练集时间短(不足1年 或者3年以内的)又或者训练数据过少(1W条以下的)
结果: 实盘有效时间不长(一般3个月-半年左右以内打回原形),容易受到市场风格影响,市场风格转变后容易遭受市场反转的回撤。
这里就不得不提一个滚动训练的操作,在笔者看来,滚动训练其实是一个更复杂的环节。
固定时间 周期 去更新模型,这种操作其实更类似于给模型叠加了一个不稳定态buff。
因为单靠固定时间周期去更新我们的训练数据 对模型重新训练,我们甚至没办法确定 新训练出来的模型,
能否比原来的模型更优秀, 有可能 新加入的数据 会使得模型坍塌,绩效甚至不如原来的模型。
3.训练时间(3-5年以上) 甚至10年其长期数据的,对比短周期模型的表现,确实数据集长一点的训练,可以让模型更充分的挖掘数据中的规律。
结果: 实盘有效时间较长(系统的鲁棒性较好),能吃到市场上涨趋势中的大部分收益。比较能发挥多因子选股原有的效能。
4.训练时间(5年以上)不择时 vx 带择时
对比下图 3个回测,一般人看到的 肯定会觉得高收益的策略 效果更好, 但是实际上在实盘中发现,
反而是回测较为一般的第1个和第2个策略的表现更好,这就有点耐人寻味了~
哪怕把选股数量提升到5-10只股票之后也发现,
不管横向看还是纵向去看,无风控不择时的情况 也比有风控 或者带择时的要好。
5.因子数量多的模型,看起来更稳定。但是更容易过拟合。
因子数量多的情况下,线性模型和决策树模型反而不如 DL -alpha 深度学习模型有效。
6.因子数量少的模型,效果反而更好。
也许是算力问题,和策略容量问题,超短周期中,市场的风格和选股偏好一般都偏向某一类因子,而且从stockranker的特征重要度 我们也能发现,基本上,选股的alpha都是头部几个因子贡献的,特征重要度低的那些因子 可以说都是陪衬。
实际上,可能我们的模型并不需要这么多的特征去学习,太多因子反而会干扰我们模型学习的进程。
后续更新待续ing……
\