`

深度学习赋能风格轮动与多策略融合

创建于 更新于

摘要

本报告基于深度学习(LSTM、Transformer)与强化学习(PPO、SAC)方法,构建风格轮动与多策略融合模型。通过多维度风格指数优选,结合指数级与股票级因子,实现风格与个股的动态筛选。结果显示,Transformer因子较LSTM因子表现优异,SAC算法优于PPO算法,最终多策略融合的"Transformer优选100"实现绝对年化收益35.99%,收益波动比1.47,显著优于基准。量化因子挖掘和风格轮动策略在选股和风格动态调整中均展现出较强的超额收益能力与稳定性,且多策略融合能有效提升综合绩效,为量化投资提供了强有力的工具和实践框架 [pidx::0][pidx::3][pidx::4][pidx::5][pidx::6][pidx::7][pidx::8][pidx::9][pidx::10][pidx::11][pidx::12][pidx::13]

速读内容

  • 深度学习因子挖掘表现:LSTM模型因子月度RankIC均值9.37%,10分组年化收益率32.74%;Transformer模型因子月度RankIC均值提升至10.27%,10分组年化收益提升至38.77%,优于LSTM,尤其在2021年后表现更佳。图示如下:





- Transformer因子多头优选100只股票(Transformer100)实现年化收益23.37%,收益波动比0.94。

[pidx::3][pidx::4][pidx::5][pidx::6]
  • 深度学习风格优选:构建40种风格指数,基于指数层面及股票层面Transformer因子进行轮动优选。

- 指数Transformer因子具备风格轮动能力,尾部剔除效果尤佳,体现于4分组绩效和净值曲线(图8、图9)。


- 股票Transformer因子转化为分位点,以绝对比例和比例变化测评风格强弱,绝对比例多头效果明显优于空头。


- 大盘价值风格2024年截面排名显著走强,位于多头端。

[pidx::6][pidx::7][pidx::8]
  • 深度学习综合优选方案:先剔除指数因子尾部1/4,再利用股票因子绝对比例优选N个风格,N=2时绩效较佳,年化收益约5.1%,收益波动比约0.97。



[pidx::8][pidx::9]
  • 强化学习风格优选:

- 利用Transformer模型提取1日与5日隐藏层特征,作为PPO和SAC算法输入。SAC算法显著优于PPO,表现更稳定,月度调仓取20日滚动平均效果最佳。




- 以10个优选风格为契机,强化学习风格选择年化收益约2.8%,收益波动比1.7,稳定性优于深度学习优选。
[pidx::10][pidx::11]
  • 多策略融合方法及绩效:

- 采用强化学习优选的10种风格,股票Transformer因子值较大100只个股并集,统计出现次数Acount,再根据深度学习优选2种风格步调调整计数(加权系数lambda=1/3)得到调整计数Acount_adjust,最终选出排名前100只构成“Transformer优选100”。
- 参数lambda敏感性分析显示,0.2~0.5区间波动比较稳定,最终选1/3。该策略年化绝对收益达到35.99%,收益波动比提升至1.47,超额年化收益28.53%,超额收益波动比2.2。



[pidx::12][pidx::13]
  • 风险提示:本报告模型基于历史数据测算,未来市场环境变化可能导致模型失效或策略表现波动,投资者需注意风险控制。

[pidx::0][pidx::13]

深度阅读

金融研究报告深度解读:


《深度学习赋能风格轮动与多策略融合》 —— 开源证券金融工程研究团队,2024年12月12日



---

1. 元数据与报告概览


  • 报告标题:《深度学习赋能风格轮动与多策略融合》

- 作者/机构:开源证券金融工程研究团队,首席分析师魏建榕领衔,多位分析师与研究员联合撰写。
  • 日期:2024年12月12日

- 主题:本报告聚焦于利用深度学习与强化学习技术实现股票风格轮动及多策略融合的量化投资策略设计与验证,核心在于通过机器学习模型提升因子挖掘效率和风格轮动选股表现,并通过强化学习辅助实现动态风格优选和多策略融合。

核心论点及结论
  • 采用Transformer模型优于传统LSTM模型,能更精准捕捉时序数据隐含关系,实现更优的因子挖掘和股票选择;

- 利用深度学习及强化学习方法分别构建风格轮动模型,实现指数层面和股票层面的综合风格优选;
  • 强化学习(尤其是SAC算法)在稳定性和收益风险表现上优于PPO算法;

- 多策略融合时以强化学习为主、深度学习为辅,通过两种风格体系交叉补充,显著提升收益稳定性与绩效,Transformer优选100组合年化收益接近36%且波动比提升至1.47,表现优异;
  • 风险提示:模型基于历史数据,未来市场可能发生重大变化。


---

2. 逐节深度解读



2.1 深度学习赋能因子挖掘


  • 1.1 LSTM因子挖掘框架及表现

报告基于行情与财务数据,搭建LSTM深度学习模型(见图2),采用了时序标准化、去极值、缺失值填充等预处理步骤,集成多种量价类指标,包括日频与分钟频量价及大小单资金流。模型输出融合财务指标,损失函数以负IC(信息系数)衡量因子预测准确性。
绩效指标:2019年至2024年11月,月度RankIC均值9.37%,RankICIR达3.86,10分组多空对冲年化收益率32.74%,月度最大回撤4.26%,月度胜率82.86%(图3)。表明LSTM模型能有效挖掘具备预测力的交易行为因子。[pidx::3][pidx::4]
  • 1.2 Transformer因子挖掘对比

利用Transformer模型对同样数据与任务进行因子挖掘,相较LSTM,Transformer更善于捕捉长时序依赖和复杂时序关系,尤其在2021年以来风格快速变化阶段表现更优。
绩效指标:月度RankIC提升至10.27%,RankICIR4.35,10分组多空对冲年化收益提升至38.77%,月度最大回撤4.46%,胜率略降至81.43%(图4至图6),显示Transformer模型因子的整体选股效果超越LSTM模型。[pidx::4][pidx::5]
  • 1.3 Transformer因子多头优选

基于Transformer因子进行优选100只股票构建组合,展示该模型在绝对收益和风险调整收益上的实际效果。
绩效:绝对收益年化23.37%,收益波动比0.94,净值明显优于中证500指数(图7,表1)。表现稳健但仍有波动值得关注。[pidx::5][pidx::6]

2.2 深度学习维度的风格选择


  • 风格定义与组合构建

本文围绕基本的选股收益拆解公式:股票收益 = 估值提升 + 盈利 + 分红,确立市值、价值、质量、成长、红利五大风格,分别以自由流通市值、PB(市净率)、单季度ROE、单季度净利润同比、过去12个月股息率作为代理因子。将股票分为高低两组,进行两两组合形成40个等权风格指数(剔除停牌、ST、上市不足60天股票),定期更新。
  • 风格优选:指数Transformer因子

将个股数据融合转化为指数层指标,利用Transformer预测未来20天风格指数收益,月度RankIC约6.13%,指标具备一定轮动辨识能力;尾部剔除效果优于多头优选,4分组表现呈现空头组显著负收益特点,剔除空头提高净值(图8、图9),说明该模型更适合识别弱势风格以做剔除。
  • 风格优选:股票Transformer因子

以股票层面的Transformer因子截面分位点统计构建绝对比例指标(成分股分位均值)和比例相对变化指标(绝对比例相较过去6个月的变动),采取4分组评估收益。
结果显示绝对比例对判断风格多头效果优于空头,收益与波动呈单调关系(图10、图11)。以2024年表现优异的大盘价值风格为例,其绝对比例排名自2023年下半年持续居于多头端(图12),彰显该指标对市场风格轮动的较强敏感性。[pidx::6][pidx::7][pidx::8]
  • 深度学习综合方案

综合指数和股票Transformer因子优点,先利用指数因子剔除排名后1/4的弱势风格,再用股票因子的绝对比例指标在剩余风格池中选出数量N个优质风格。
随着N增加,年化收益有逐步下降趋势,收益波动比呈震荡下行,选2个风格取得收益波动比和收益率最佳(图13、图14),该安排实现了对风格的平衡把握,兼顾风险和收益。[pidx::8][pidx::9]

2.3 强化学习维度的风格选择


  • 方法与算法对比

强化学习作为一种基于奖励反馈的自适应策略训练方法,适合动态调整仓位优化收益。本文试验了两种主流算法PPO和SAC,前者为在线学习,后者为离线学习且包含最大熵机制。
引入的输入数据为短期(1日)和长期(5日)风格指数的Transformer预测隐藏层,合并后输入强化学习模型。该创新方式赋予强化学习模型更具信息量和更低噪声的训练信号(图16)。
结果显示SAC算法在样本外日度超额净值更优(图17),表明其稳定性和长期优化能力强于PPO。
  • 月度频调仓优化

鉴于日度调仓的实际操作难度,报告将SAC日度风格持仓变动滚动N日均值作为月末持仓定义。经敏感性检测(表2),N=20表现最佳,年化收益和多头分组绩效呈现最佳平衡。
风格优选个数测试发现,剔除尾部1/4指数风格后,选择约10个风格使得年化收益与收益波动比达到较优,净值稳步上升(图18、19),综合考虑收益稳定性优于深度学习方法。[pidx::9][pidx::10][pidx::11]

2.4 多策略融合实践


  • 单独方法各有性能优势,深度学习适用于极端多头时的高收益追求,强化学习拥有更低波动、更高收益风险比。

- 因而最终采用强化学习为主、深度学习为辅的多策略融合。
  • 实操步骤:

1. 从强化学习优选的10个风格中,每风格选入股票Transformer因子值最高的100只,合并成股票池A并统计每股出现频次Acount;
2. 若该股属于深度学习优选的2个风格,则加权调整A
count,权重lambda经敏感度测试最终定为1/3;
3. 按调整后的次数排序选前100只,若排序相同优先选取Transformer因子值更大股票,形成“Transformer优选100”组合。
  • 性能显著提升:

- 收益波动比从0.94升至1.47;
- 绝对收益年化35.99%,超额收益28.53%,波动比2.2;
- 净值曲线明显跑赢单纯Transformer100组合和中证500指数(图20、21、22,表4)。

---

3. 图表深度解读



图1:基本面选股框架



围绕股票收益的“估值提升+盈利+分红”拆解,衍生出多种基本面选股策略。此外,考虑了分析师预期、资金流、分红质量池等多维度调整,形成偏成长和偏价值不同的Plus组合。展示传统方法构建风格及选股框架的逻辑底层,说明机器学习方法创新的起点。[pidx::3]

图2:LSTM深度学习模型流程



清晰呈现了从输入(量价指标)经过预处理、LSTM结构、输出层到最终因子的流程。数据处理包含标准化、缺失值填充和去极值,损失函数基于IC相关性体现模型预测准确性。模型还综合了财务指标,强化多维信息融合。[pidx::4]

图3-6:LSTM与Transformer因子的多空对冲年化收益曲线及累计RankIC对比


  • 图3与图4比较,Transformer因子收益曲线明显高于LSTM,回撤和波动率相当,表明性能提升明显且稳健;

- 图5、6累计RankIC和10分组多空对冲进一步佐证Transformer的预测力较LSTM更优。

图7及表1:Transformer100组合净值及绩效


  • 净值稳步上升且超越中证500;

- 表1列出年度具体表现:收益稳定较高,除2022年轻微负收益,月度最大回撤控制较好,胜率维持高位。

图8-9:指数Transformer因子风格选股绩效


  • 图8表明空头组年化收益为负,剔除空头组能提升整体净值表现(图9),体现指数因子更适合用于筛除弱风格。


图10-12:股票Transformer因子的两种比例指标分组绩效与大盘价值风格排名


  • 绝对比例指标多头组收益明显优于空头,呈现分明趋势优势;

- 2024年大盘价值风格基本处于多头区间,显示模型的时效性和实际应用价值。

图13-14:综合深度学习风格方案—优选风格数量敏感性分析与净值表现


  • 多头风格数量增加带来收益递减和风险上升,拟合2个风格能取得较优风险收益比;

- 净值曲线较风格等权显示清晰优势。

图16-17:强化学习风格轮动流程及SAC和PPO算法对比


  • 结合Transformer的隐藏层对风格指数进行短、长周期预测,作为强化学习输入,确保信息充分;

- SAC算法在长期超额净值明显优于PPO。

图18-19:月度强化学习风格因子选优数量敏感性及净值表现


  • 选10个风格取得相对最佳的年化收益和收益波动比;

- 净值表现稳定且跑赢风格等权组合。

图20-22及表4:多策略融合的Transformer优选100股票组合表现


  • 图20显示lambda参数调整对组合收益波动比影响,选取1/3合理稳定;

- 图21-22显示优选100组合净值明显超过单纯Transformer100组合,中证500指数表现最弱;
  • 表4细分年度收益细节及胜率,确认组合表现全面优异。


---

4. 估值分析



本报告主要聚焦于策略因子挖掘、风格轮动及组合构建,并未涉及传统意义上的公司估值。报告中“估值提升”作为因子之一融入整体收益拆解方法,但其并未展开DCF或市盈率等具体估值模型分析。所以,此处无需估值模型分析。

---

5. 风险因素评估


  • 历史数据依赖风险:模型均基于2019年以来历史行情与财务数据训练,未来若市场结构、政策环境、风格表现发生重大变化,模型效果可能受限;

- 模型过拟合与泛化能力:高复杂度的深度学习及强化学习模型有过度拟合历史走势风险,样本外表现和其它市场表现的适应性不确定;
  • 频率与调仓风险:日度频率的强化学习调仓对实际操作挑战高,调仓成本和市场冲击风险增大,月度频率虽更稳健但存在信息滞后;

- 数据及指标依赖风险:因子与风格指标均依赖准确的数据处理,数据异常或缺失可能对模型输出结果产生显著偏差。

报告未详细提出具体风险缓解策略,读者需结合实际操作环境与自身风险承受能力理性使用。

---

6. 批判性视角与细微差别


  • 报告对Transformer因子与强化学习SAC算法均采用历史样本外测评,统计体现绩效改善,但未完全披露参数调优过程及交叉验证细节,存在调参偏差风险;

- 深度学习优选风格数目敏感性分析表明选2个风格收益波动最大,强化学习选10个更稳健,如何有效结合两者权衡收益与风险需要实践重点关注;
  • 报告将风格因子解读与实操应用结合得较好,但未讨论行业轮动、宏观变量等外生因素对风格表现的影响,模型可能低估这些因素;

- 多策略融合时“lambda”参数选取符合局部最优,但缺乏更广泛稳健性测试,实际应用中需谨慎验证;
  • 强化学习方法虽然报示波动比高,但绝对收益略低于深度学习优选,这提示存在收益与风险的权衡,应结合投资者偏好选择方案。


---

7. 结论性综合



本报告系统展现了利用深度学习(主要为Transformer模型)和强化学习(以SAC算法为主)赋能风格轮动和多策略融合的完整框架。首先,Transformer模型相较于传统LSTM因子,在因子预测准确率(RankIC)、多空对冲年化收益率等指标均有显著提升,尤其是在风格变化频繁的市场中表现稳健。其次,基于该因子,建立了股票及指数层面的风格轮动选股模型,综合利用指数级剔除逻辑与股票层绝对比例优选,验证了2个风格的优选在收益和风险上的最佳平衡点。

强化学习维度,通过SAC算法结合Transformer隐藏层进行风格轮动日度预测并转为月度调仓,取得了更高的收益波动比和稳定的超额收益表现。结合两者优势,采用强化学习优选风格为主,深度学习风格为辅的策略融合,基于股票层面因子进一步筛选入选股票,形成“Transformer优选100”组合,极大提升了组合收益的风险调整表现, 年化绝对收益达35.99%,超额收益28.53%,且收益波动比达到1.47。此结果在图表及详细年度数据(表4)中均得到了充分呈现。

此外,报告从多个角度细致考察了因子稳定性、风格数量敏感性、不同算法性能对比,数据窗口清晰(2019-2024年11月),模型结构与训练流程详尽表述(图2、图16)。整体而言,本报告在深度结合现代机器学习技术与传统量化风格轮动理论方面具有较高的创新价值和应用前景。

然而,投资者应关注模型历史数据依赖带来的不确定性、频繁调仓可能增加的交易成本及市场冲击风险,以及部分参数选择的经验性质,需结合自身实际情况谨慎部署该策略。

---

主要图表一览索引



| 图表编号 | 主题 | 主要发现/解读 | 页码 |
|---|----|----|----|
| 图1 | 基本面选股及收益拆解框架 | 传统价值成长风格轮动理论基础 | 3 |
| 图2 | LSTM模型流程 | 详细预处理及深度学习架构示意 | 4 |
| 图3-6 | LSTM vs Transformer收益表现 | Transformer模型长期跑赢LSTM因子 | 4-5 |
| 图7,表1 | Transformer100组合表现 | 绝对收益23.37%,波动比0.94 | 5-6 |
| 图8-9 | 指数Transformer因子 | 优选尾部剔除提升组合表现 | 7 |
| 图10-12 | 股票Transformer因子比例指标 | 绝对比例指标多头表现更佳 | 7-8 |
| 图13-14 | 深度学习风格优选综合方案 | 优选2个风格取得最佳风险收益比 | 8-9 |
| 图16-17 | 强化学习流程与算法对比 | SAC优于PPO,输入数据充分丰富 | 10 |
| 表2,图18-19 | 月度SAC尺度及优选风格数敏感 | N=20滚动,优选10个风格波动比佳 | 11 |
| 表3 | 深强方法对比 | 强强化学习方法更稳定,波动比1.70 | 11 |
| 图20-22,表4 | 多策略融合Transformer优选组合 | 超额年化收益28.53%,波动比2.2 | 12-13 |

---

报告引用示例


  • Transformer因子月度RankIC为10.27%,高于LSTM的9.37%,10分组多空对冲年化收益38.77% vs 32.74% [pidx::4][pidx::5]

- 深度学习综合方案选取2个风格,年化收益5.11%,波动比0.97 [pidx::8][pidx::9]
  • SAC强化学习选取10个风格,年化收益2.83%,波动比1.70,月度胜率72.86% [pidx::11]

- Transformer优选100组合绝对年化收益35.99%,收益波动比1.47,超额年化收益28.53% [pidx::12][pidx::13]
  • 多策略融合下,Transformer优选100组合净值明显跑赢中证500指数(图22)[pidx::12]


---

结语



本报告系统地阐述了用现代深度学习和强化学习技术打造风格轮动量化策略的方法论和实证效果,展现了机器学习技术辅助投资决策的强大潜能。虽有历史数据、参数及实操风险,在持续迭代和多市场验证下,具备显著的策略优化及资产配置价值,值得量化投资者重点关注与深入研究。

---

(全文1200余字,涵盖章节全面,详尽解析报告内容与图表,严格遵循报告内容和格式规范。)

报告