`

选股因子系列研究(八十八)——多颗粒度特征的深度学习模型:探索和对比

创建于 更新于

摘要

本报告围绕多颗粒度深度学习模型在量价数据中的应用,重点探索了多级频率特征融合与改进方案。通过单颗粒度与多颗粒度模型对比,发现多颗粒度输出集成显著提升因子有效性,年化费前超额收益最高达31.5%。引入注意力机制的双向AGRU模型进一步缓解信息遗忘,Rank IC和多头超额收益全面提升,Top10%组合费前超额达33%,Top100组合达40%。复现微软亚研院多颗粒度残差学习网络,发现效果未超过输出集成模型。基于双向AGRU多颗粒度模型,构建中证500和中证1000指数增强组合,分别实现年化超额收益15%-20%与25%-30%,且在2023年亦保持较好收益表现,成分股约束会产生一定的收益下降 [page::0][page::4][page::5][page::6][page::7][page::8][page::10][page::11][page::12][page::14]。

速读内容

  • 单颗粒度模型比较(2017-2023.07)[page::4]:

| 标签长度 | 特征颗粒度 | Rank IC | ICIR | 胜率 | Top10%组合年化超额收益(费前) | Top100组合年化超额收益(费前) |
|---------|------------|--------|-------|-------|------------------------------|-------------------------------|
| 5日 | 日度 | 0.118 | 7.54 | 87% | 30.3% | 37.2% |
| 5日 | 60分钟 | 0.116 | 7.35 | 86% | 27.1% | 31.9% |
| 5日 | 30分钟 | 0.119 | 7.56 | 87% | 28.7% | 31.9% |
| 10日 | 日度 | 0.121 | 7.37 | 87% | 31.5% | 34.3% |
| 10日 | 60分钟 | 0.119 | 7.33 | 86% | 29.6% | 32.1% |
| 10日 | 30分钟 | 0.117 | 7.20 | 85% | 27.3% | 30.7% |

- 日度特征整体表现更佳,但部分年度60分钟与30分钟特征在某些年份表现更优,显示多颗粒度特征具有互补性。
  • 多颗粒度模型介绍及表现提升 [page::5][page::6]:

- “多颗粒度输入,一次性训练”(图1)和“单颗粒度训练,输出集成”(图2)两种融合方案被提出。
- 多颗粒度模型Rank IC普遍高于单颗粒度,输出集成方式表现最佳,10日标签费前年化超额最高达31.5%。

| 标签长度 | 模型 | Rank IC (T+1均价) | 10日标签年化超额收益(费前) |
|----------|----------------|-------------------|----------------------------|
| 5日 | 输出集成 | 0.139 | 31.5% |
| 10日 | 输出集成 | 0.136 | 31.5% |
  • 双向AGRU模型改进及收益表现提升 [page::6][page::7][page::8]:





- 结合注意力机制,采用双向GRU(AGRU)缓解信息遗忘。
- 单颗粒度模型中,双向AGRU平均提升费后多头超额收益约4-5%(表5)。
- 双向AGRU多颗粒度模型表现全面优于单向GRU,周均Rank IC超过0.12,Top10%组合费前多头超额达33%,Top100组合达40%(图6-7,表6)。
- 费后收益仍保持较高水平,分别约24%和30%。
- 超额收益在2019-2022年间较为均匀,2023年YTD分别约18%(Top10%)和21%(Top100)(图8-9)。
- 2023年1-7月,Top10%组合累计超额收益走势平稳,但出现两段回撤(图10)。
  • 多颗粒度模型在不同选股空间表现差异明显 [page::9]:





- 模型在中证800成分股中表现较弱,Rank IC仅0.08-0.09,多头超额约20%。
- 在中证1000、国证2000和国证3000等较大范围选股空间表现优异,Rank IC高于0.12,费前多头超额均超30%。
- 成交活跃度筛选(前20%成交金额)也保持良好表现。
- 2023年选股有效性在沪深300成分股表现升温,YTD超额收益达到14%-16%。
  • 多颗粒度残差学习网络复现 [page::10][page::11]:





- 结构包括时序信息编码(双层GRU)、预测网络和细粒度重构网络。
- 通过残差消除不同颗粒度间信息冗余,增强特异性。
- 训练和计算成本较高,仅测试日度和30分钟两颗粒度。
- 结果显示该方法整体不及输出集成模型,部分年份表现较优但未达到预期。
- 结果或因超参数选择影响,后续仍需优化。
  • AI指数增强组合构建与实证 [page::11][page::12][page::13]:

- 使用双向AGRU多颗粒度模型输出作为预期收益,构建周度调仓的中证500和中证1000增强组合。
- 风控策略包括个股权重偏离限制(0.5%或1%)、行业中性与偏离限制、因子暴露约束、成分股权重约束(最多80%)、换手率限制等。
- 中证500组合无成分约束时,年化超额收益15%-20%,2023年YTD为10%-16%;加约束后降至10%-15%及7%-12%(表8-10)。
- 中证1000组合无成分约束年化超额收益为25%-30%,2023年YTD为15%-18%;加约束后收益降至22%-28%及11%-16%(表11-13)。
- 中证1000组合强于中证500组合,在深度学习选股模型中表现更稳定。
  • 总结 [page::14]:

- 多颗粒度特征融合提升因子有效性和收益,输出集成方法优于混合输入和残差学习网络。
- 引入注意力加权与双向GRU显著缓解信息遗忘,提升模型表现。
- AI增强组合基于此方法,实现显著的年化超额收益。
- 市场系统性风险、流动性风险、政策变动及因子失效风险为主要风险提示。

深度阅读

资深金融分析报告详尽解读与剖析


——《选股因子系列研究(八十八)——多颗粒度特征的深度学习模型:探索和对比》海通证券研究所



---

1. 元数据与报告概览



报告标题: 选股因子系列研究(八十八)——多颗粒度特征的深度学习模型:探索和对比
作者及分析师: 冯佳睿,袁林青
发布机构: 海通证券股份有限公司研究所
发布时间: 2023年
研究主题: 深度学习选股因子的创新模型研究,重点聚焦多颗粒度特征(不同数据频率下的量价特征)对选股模型表现的影响及优化。

核心论点与结论:
  • 传统使用单颗粒度(日度或小时级)特征的深度学习模型已表现出良好的选股能力,但更细颗粒度(如30分钟级别)的特征依然蕴含增量信息。

- 报告探索了两类多颗粒度模型:多颗粒度输入一次训练(混合输入)和单颗粒度训练后输出集成(输出集成),后者表现最佳。
  • 融入注意力机制并采用双向GRU(即双向AGRU)显著改善了因子表现,提升了相关性指标及超额收益。

- 复现微软亚研院提出的多颗粒度残差学习网络,但在本地测试中未超越输出集成模型。
  • 以双向AGRU多颗粒度模型构建中证500和中证1000指数增强组合,年化超额收益分别达到15%-20%和25%-30%,且稳定性和收益分布良好。

- 报告强调了系统性风险、流动性风险、政策变动及因子失效风险对模型的潜在影响。

整体而言,报告结合最新深度学习技术针对量化选股因子的创新设计进行了实证验证,展现了多数据频率协同提高选股准确性的前沿研究成果。[page::0,4,14]

---

2. 详细章节解读与分析



2.1 选股因子的单颗粒度模型表现(第1章)


  • 报告使用不同时间尺度(日度、60分钟、30分钟)构造量价特征输入深度学习模型,检验单颗粒度模型的有效性。

- 数据覆盖2017至2023年7月,基于次日均价假设进行回测,考虑双边交易成本0.3‰。
  • 从表1看,日度特征训练的模型整体呈现最高的年化超额收益(Top10%组合30.3%,Top100组合37.2%)及Rank IC,表明较粗的时间颗粒度特征具备较强预测能力。

- 但年度表现差异明显(表2),部分年份中60分钟或30分钟粒度更优,如2017、2018和2023年60分钟表现更好,而2022年30分钟特征更优。
  • 结论是日度特征不能覆盖所有信息细节,更细颗粒度仍有额外增量信息,激发后续多颗粒度模型的探索需求。[page::4]


2.2 多颗粒度模型设计与比较(第2章)


  • “多颗粒度输入,一次性训练”(混合输入)模型:多颗粒度特征输入,分别用独立GRU提取序列特征,输出合并经MLP预测标签。

- “单颗粒度训练,输出集成”模型:对不同颗粒度特征分别训练,最后对预测结果简单平均集成。区分集成全部三颗粒度与仅集成最粗和最细两颗粒度(输出集成1)。
  • 表3显示多颗粒度模型在Rank IC指标上普遍优于单颗粒度单模型,尤其输出集成方式表现最佳。

- 表4分年度超额收益进一步验证:多颗粒度模型在各年中多次超过任何单颗粒度模型,整体年化超额收益提升至31.5%左右。
  • 该章节体现了不同时间尺度信息互补性的挖掘价值,简洁集成策略即可带来收益和稳定性的提升。[page::5,6]


2.3 双向AGRU模型的引入与效果(第3章)


  • 针对传统单向GRU易遗忘序列早期信息的问题,引入注意力机制和双向GRU学习思路(双向AGRU),提升模型记忆和信息捕捉能力。

- 图3展示了注意力机制对历史隐状态的加权方式,增强了模型对关键时点的关注。
  • 双向AGRU显著提升了各颗粒度模型及多颗粒度模型的超额收益(图4-7,表5-6)。

- 以“Top10%”与“Top100”收益组合来看,费前多头超额收益均有大幅提升,费后超额收益平均增幅约4-5%。
  • 具体数据如双向AGRU多颗粒度输出集成模型,周均Rank IC超过0.12,费前Top10%组合收益达33%,Top100组合达40%。

- 超额收益显著且稳定,表明引入的注意力和双向机制有效缓解了长期依赖问题,模型能力明显增强。[page::6,7,8]

2.4 多颗粒度残差学习网络复现及评价(第4章)


  • 复现微软亚研院提出的多颗粒度残差学习网络(图14),该网络通过残差计算去除不同粒度间信息冗余,保留特有特征。模块架构包括时序编码、预测和细粒度重构三部分。

- 实现中仅测试日度和30分钟两颗粒度,因模型复杂训练开销大。
  • 表7-11显示残差学习模型未优于简单的输出集成,反而在Rank IC、ICIR和超额收益方面均落后。

- 分年度分析(图15-16)显示残差网络在2019及2023较好,但2021和2022表现较弱,原因可能包括未调优超参数和训练复杂度限制。
  • 结论是残差网络理论新颖,但实际应用推广中需精细调参和改进,当前简单集成方法已具备极强竞争力。[page::10,11]


2.5 AI指数增强组合构建与实证(第5章)


  • 选用双向AGRU多颗粒度模型输出作为预期收益预测,设计周度调仓的中证500和中证1000AI增强组合。

- 风控约束包括个股权重偏离、市值和估值中性因子暴露、行业偏离限制、选股空间及换手率限制,实际交易假设次日均价成交及双边0.3‰交易成本。
  • 中证500组合年化超额收益15%-20%,2023年YTD达10%-16%,加成分股权重限制后下降至10%-15%。分年度风险指标显示最大回撤控制在5.1%以内,信息比率稳健。

- 中证1000组合更优,年化超额收益达25%-30%,2023年YTD为15%-18%,加权限制影响较小,仍维持23%-27%的超额收益。
  • 表8-13详尽展示了不同风控参数下组合表现及风险特征,验证了模型实际应用的可行性和稳定性。

- 组合超额收益稳定,风险调整后表现优异,说明多颗粒度深度学习模型在实际投资中具备较大潜力。[page::11,12,13]

2.6 总结与风险提示(第6章)


  • 明确指出单颗粒度特征已能实现不俗选股成绩,但多颗粒度融合进一步挖掘潜力,特别是输出集成方式表现最佳。

- 双向AGRU引入注意力机制和双向学习显著改善记忆表征,提升因子相关性和超额收益,Top10%组合年化费前收益达33%。
  • 多颗粒度残差学习网络虽理论先进,但实验尚未展现优势,后续研究将深化调参。

- 基于多颗粒度模型构建的指数增强组合在历史测试中获得显著且稳定的超额收益。
  • 风险提示涵盖市场系统性风险、流动性风险、政策变动及因子失效风险,体现风险管理意识。[page::14]


---

3. 图表深度解读



表1-2 单颗粒度模型表现(第1章,页4)


  • 表1呈现单颗粒度不同频率特征模型的Rank IC、胜率及费前费后的年化超额收益等指标,日度模型整体领先。

- 表2揭示分年度表现差异,如某些年份高频数据模型胜出,证明多颗粒度融合的必要。

图1-2 多颗粒度模型结构(第2章,页5)


  • 图1展示了混合输入模型的结构方案,三颗粒度特征并行输入,独立GRU编码后合并。

- 图2为输出集成模型,独立训练不同颗粒度模型并集成各自输出。

表3-4 多颗粒度模型Rank IC及超额收益(第2章,页5-6)


  • 表3显示多颗粒度模型在不同调仓频率和成交价格假设下普遍提升Rank IC。

- 表4年化收益表明输出集成在所有年份表现稳健优越。

图3 注意力机制示意(第3章,页6)


  • 形象说明GRU引入注意力权重,对时间序列各时点隐状态加权,增强记忆能力。


图4-7 双向AGRU模型超额收益对比(第3章,页6-7)


  • 图4-5展示单颗粒度双向AGRU与传统GRU的Top10%及Top100组合超额收益增幅。

- 图6-7则反映多颗粒度双向AGRU模型在不同组合的超额收益表现,双向AGRU明显超越单向GRU。

表5-6 双向AGRU模型表现统计(第3章,页7)


  • 细化业绩指标,Rank IC增幅稳定,费前后年化超额收益均显著提升,验证双向和注意力的有效性。


图8-10 多颗粒度双向AGRU组合年度收益和2023年累计收益表现(第3章,页8)


  • 图8-9呈现2017-2023年间超额收益在时间序列上分布,展示收益稳定性。

- 图10反映2023年组合在多次回撤后实现快速且稳定回升。

图11-13 在不同选股空间的表现(第3章,页9)


  • 图11 Rank IC指标分市场区间表现,沪深300和中证800区间表现较弱,1000及国证2000外更为强劲。

- 图12-13年化超额收益对应相同规律,显示模型在宽选股空间表现更佳。

图14 多颗粒度残差学习网络结构示意(第4章,页10)


  • 详细展现多模块叠加与残差计算流程,体现信息冗余剔除和特征对齐设计。


表7、多颗粒度残差学习网络周度选股能力(第4章,页10-11)


  • 显示残差学习网络较单颗粒度和输出集成轻微逊色。


图15-16 多颗粒度残差学习网络分年度超额收益(第4章,页11)


  • 年度表现波动较大,2021、2022年明显落后,验证模型在调参和稳定性上尚有空间。


表8-13 AI指数增强组合业绩(第5章,页12-13)


  • 详细记录了中证500和中证1000增强组合在不同风控约束和训练标签长度下的稳定超额收益表现。

- 包含年度收益、最大回撤、跟踪误差、信息比率及月度胜率,为投资实操提供清晰依据。

---

4. 估值分析



本报告聚焦于选股因子研发和实证表现,未直接涉及上市公司具体估值方法或目标价设定,因此估值分析部分不适用。

---

5. 风险因素评估



报告明确列示以下风险因素:
  • 市场系统性风险: 整体市场行情波动可能导致选股模型表现偏离预期。

- 资产流动性风险: 特别是中证1000及大盘外股票,流动性不足可能限制组合实践效果。
  • 政策变动风险: 监管政策调整影响行业和交易行为,可能破坏模型稳定性。

- 因子失效风险: 模型依赖的特征和关系可能因市场环境变化而失效。

风险提示虽简明,但涵盖了金融量化研究及实操应用中常见的核心风险,大致向投资者传递了风险警示。[page::0,14]

---

6. 审慎视角与细微差别分析


  • 模型复杂度与实用性权衡: 报告指出Transformer等更复杂模型因训练样本有限未作深入尝试,转而在传统GRU增加注意力机制,双向学习实现了效益最大化,符合实证金融中“简单有效”原则。

- 残差学习网络的局限: 虽理论设计精巧,但本地复现未达预期,提示在实际应用中该网络对超参数敏感且训练成本高,需谨慎期待其推广。
  • 数据假设与交易成本设置: 次日均价成交和固定交易成本假设,与实际市场操作有偏差,实际滑点或成交价偏差可能影响收益。

- 选股范围和权重约束影响: 明确显示成分股权重约束对收益有显著影响,尤其中证500组合,显示组合实际可操作性时需权衡流动性和超额收益。
  • 年度收益波动提示配置风险: 不同年份表现差异显著,尤其2021-2022年因子表现下降,需关注策略的动态调整和市场适应性。

- 多颗粒度特征的信息冗余与互补性: 报告中多次强调不同频率特征间既有重复又有增益,模型设计需充分处理信息重叠,避免过拟合。

总结来看,报告整体严谨,实证扎实,在技术创新和应用之间保持稳健,但对复杂模型的推广效果需要进一步研究深化。

---

7. 结论性综合



本报告立足于量化选股因子研发,基于海通证券多年研究积累,创新引入多颗粒度量价特征融合和深度学习模型优化方案,结合丰富线上样本及严格实盘假设验证,作出以下主要结论:
  • 单颗粒度(日度、小时、30分钟)特征在深度学习模型中均能带来稳定超额收益,但细颗粒度含有独特有效信息,不能被忽略。

- 两类多颗粒度融合策略中,基于输出集成的方案优于混合输入,多时间尺度的信息融合提升了Alpha捕获能力和稳健性,年化费前超额收益提升约1-3个百分点。
  • 结合注意力机制与双向GRU的双向AGRU模型,显著增强了时间序列依赖结构,缓解了信息遗忘,实现多指标全方位提升,费前年化超额收益Top10%组合达33%,性能稳健领先。

- 微软多颗粒度残差学习网络虽具理论优势,但本地复现效果不及简单集成模型,显示实证应用需充分调参与优化。
  • 基于最佳多颗粒度模型输出,实盘模拟构建的中证500和中证1000 AI增强组合,表现稳定,年化费后超额收益分别达10%-15%和23%-27%,适应不同风险偏好和市场条件。

- 风险识别全面,提醒投资者关注系统性风险和模型失效等因素。

图表数据清晰展现了模型性能的提升路径和实盘应用优势,深度刻画了多颗粒度模型在中国证券市场的实际表现和应用价值,具有较强的研究和投资指导意义。

---

附:关键图片示例

多颗粒度输入一次性训练模型结构:



双向AGRU注意力机制示意图:



双向AGRU多颗粒度模型Top10%组合超额收益比较:



多颗粒度残差学习网络架构示意:



双向AGRU多颗粒度模型在不同选股空间的Rank IC表现:



---

以上为报告的全面分析解读,涵盖结构框架、关键数据和图表剖析,提供了清晰且深入的理解,便于金融分析师和投资者把握报告实质与投资价值。[page::0-14]

报告