DeepAlpha-DNN VS Lightgbm 实践报告
由dkl297836创建,最终由dkl297836 被浏览 315 用户
作者:dkl297836
策略思想
基于32个短期价量因子,训练集使用2016年1月1日至2020年12月31日共5年数据,每个交易日买入模型当日预测结果排名靠前的10只A股股票,个股最大仓位限制为20%,持股时间设置为5个交易日,初始资金100万。
Lightgbm策略
原有策略是基于Lightgbm机器学习算法,该策略的表现见图1:
该策略在近一年半的回测期内收益率为9.35%,相对收益率为33.24%(基准为沪深300指数),Alpha为0.22,年化收益率为6.73%,但夏普比率较低,且收益波动性较大,最大回撤超过了30%。尤其是进入2022年以来,截止2022年6月10日,该策略录得负收益率,超额收益率接近于0。具体表现见图2:
Deepalpha-DNN VS Lightgbm
使用相同的32个因子,相同的5年训练数据,保持相同的回测设置,采用DNN算法对原策略进行优化。隐藏层为3层,激活函数选择RELU,优化后的策略表现见图3:
回测结果表明,优化后的策略在除胜率外的各方面表现均有明显提升:回测期内收益率达到了80.74%,相对收益率达到了119.03%,Alpha提升至0.73,年化收益率大幅提升至53.7%,Beta较原策略下降了0.11,使得系统性风险有了一定程度的下降。尤其值得一提的是,优化后的策略的最大回撤控制在了15%以内,较原策略有大幅改善。经过DNN优化后的策略今年来(截止2022年6月10日)的表现见图4:
从图4可以看出,经DNN优化后的策略在2022年的表现也明显优于原策略,截止2022年6月10日,该策略取得正收益率,获得了约23%的相对收益率,体现出了较强的抗风险能力。
DeepAlpha-DNN策略分析
DeepAlpha-DNN的优势
DNN在量化交易中使用的比较多,关于算法本身的优势在关于DNN的各种研究资料中均有非常专业的介绍。由于本人能力有限,无法得出更富有新意的专业看法,但就具体实践而言,本人认为DNN在量化交易中的优势体现在以下两个方面:
- 灵活性。在本次实践中,无论是基准DNN策略还是本人构建的32因子策略,选取的都是非常基础的市场因子,几乎没有对具体因子做筛选,但本人多次实验表明,基于DNN的策略的表现往往都不会差到离谱。这表明DNN能够从最基础、最简单的价量因子中尽可能的找到市场的隐藏信息。另外,无论是基准DNN策略的98个因子还是本人所使用的32个因子,使用的因子数量都比本人所使用的机器学习算法要多,但DNN并没有表现出明显的过拟合迹象,依然能探寻到因子背后的规律,这从另一个角度体现出了DNN的灵活性。
- 稳定性。在实际交易中,资金量较大时往往都会采用分散持股的方式来降低个股交易金额对市场行情的冲击。但大多数量化模型选出的适合当日买入或持有的个股的表现往往都会随着当日数量的增多而变差,且当日最优交易标的和次优交易标的的表现可能会有较大差距,这就导致持股过多会使得策略的整体收益率明显下降。但就基于DNN的策略而言,虽然也会存在类似的情况,但策略预测出的排名靠前的交易标的之间的差异往往较小,大量持股对策略整体收益率的影响相对较小,个人认为采用DNN策略有助于实现持股分散化和保持收益率两者间的平衡。
DeepAlpha-DNN的不足
有效性
虽然基于DNN的策略的表现一般都不会很差,但不得不说的是,表现非常优异的策略也比较少。通过本次实践发现,在没有其他干预(如大盘风控)的情况下,如果减少每日买入股票的数量且(或)提高个股最大持仓占比时,策略的整体收益可能不会提升很多,但会导致最大回撤有大幅增加。对于小资金而言,基于DNN的策略可能并不是最优选择。
易用性
由于DNN是神经网络算法,相对较难理解,模型的复杂性相较于一般的机器学习算法会有所增加。另外,DNN模型输入因子较多,导致在模型训练过程中需要进行大量计算,对算力的要求较高,模型训练的时间偏长,个人投资者在研究该模型时会受到较多的限制。