选股因子系列研究(八十八)——多颗粒度特征的深度学习模型:探索和对比
创建于 更新于
摘要
本文探索了融合不同频率特征(如日度、60分钟、30分钟)构建多颗粒度深度学习选股因子模型。通过“多颗粒度输入一次性训练”和“单颗粒度训练输出集成”两种方法比较,发现输出集成在收益表现上优于单颗粒度模型,10日标签费前年化超额收益最高可达31.5%。引入双向注意力GRU(AGRU)进一步提升模型记忆能力,使得Rank IC超过0.12,Top10%和Top100组合费前多头超额收益分别达33%和40%。微软亚研院的多颗粒度残差学习网络被复现验证,但表现不及输出集成模型。基于双向AGRU多颗粒度模型构建的中证500及中证1000周度指数增强组合,在无成分股约束条件下分别实现15%-20%和25%-30%的年化超额收益,2023年YTD超额收益分别达10%-16%及15%-18%[page::0][page::4][page::5][page::7][page::8][page::10][page::11][page::12][page::13][page::14]
速读内容
单颗粒度模型表现对比 [page::4]
| 标签长度 | 颗粒度 | Rank | ICIR | 胜率 | Top10%组合年化超额收益 | Top100组合年化超额收益 |
|---------|--------|------|------|------|---------------------|-----------------------|
| 5日 | 日度 | 0.118| 7.54 | 87% | 30.3% | 37.2% |
| 5日 | 60分钟 | 0.116| 7.35 | 86% | 27.1% | 31.9% |
| 5日 | 30分钟 | 0.119| 7.56 | 87% | 28.7% | 31.9% |
| 10日 | 日度 | 0.121| 7.37 | 87% | 31.5% | 34.3% |
| 10日 | 60分钟 | 0.119| 7.33 | 86% | 29.6% | 32.1% |
| 10日 | 30分钟 | 0.117| 7.20 | 85% | 27.3% | 30.7% |
- 单颗粒度模型中日度特征普遍贡献更高超额收益,但部分年份60分钟或30分钟颗粒度表现更佳。
- 高频特征含有增量信息,值得开发更高效的多颗粒度模型。
多颗粒度模型表现对比 [page::5]
- 两类多颗粒度模型架构:(1)混合输入一次性训练,多层GRU独立抽取不同频率信息后合并输出;(2)单颗粒度训练输出集成,简单均值集成不同模型预测。
- 多颗粒度模型整体提升Rank IC,输出集成表现最佳,10日标签年化超额收益达31.5%。
双向AGRU模型及性能提升 [page::6][page::7]

- 引入注意力机制改进GRU,使用双向学习序列缓解记忆遗忘问题。
- 双向AGRU单颗粒度模型对比传统GRU,年化多头超额收益平均提升4%-5%。
- 双向AGRU多颗粒度模型表现显著,周均Rank IC>0.12,Top10%组合费前超额收益约33%,Top100达到40%。
多颗粒度残差学习网络表现 [page::10][page::11]
- 微软亚研院多颗粒度残差网络通过残差剔除重复信息,保留特有频率信号。
- 初步复现显示该模型性能不及输出集成模型,部分年度表现较优。
AI指数增强组合实证 [page::11][page::12][page::13]
- 建立基于双向AGRU多颗粒度模型输出的中证500/1000周度调仓AI指数增强组合。
- 中证500组合年化超额收益15%-20%,2023年YTD为10%-16%,加权约束后收益下降至10%-15%。
- 中证1000组合年化超额收益25%-30%,2023年YTD为15%-18%,加权约束后收益下降至23%-27%。
| 组合名称 | 年化超额收益区间 | 2023年YTD超额收益 |
|--------|-------------|--------------|
| 中证500(无约束) | 15%-20% | 10%-16% |
| 中证500(80%约束) | 10%-15% | 7%-12% |
| 中证1000(无约束) | 25%-30% | 15%-18% |
| 中证1000(80%约束) | 23%-27% | 11%-16% |
- 风控条件及标签长度对组合表现存在一定影响,模型在不同选股空间表现差异明显。
主要风险提示 [page::0][page::14]
- 市场系统性风险
- 资产流动性风险
- 政策变动风险
- 因子失效风险
深度阅读
海通国际研究报告全面深度解读与剖析——“多颗粒度特征的深度学习模型:探索和对比”
---
1. 元数据与报告概览
报告标题:选股因子系列研究(八十八)——多颗粒度特征的深度学习模型:探索和对比
作者信息:冯佳睿 (Jiarui Feng) 和 Amber Zhou,由海通国际证券研究团队联合发布
发布时间:最新数据截止2023年7月
发布机构:海通国际证券集团(HTISG)旗下海通国际研究有限公司及其全球成员单位
研究主题:探讨基于不同时间颗粒度(频率)的量价特征,构建深度学习模型(特别是GRU及其变体),用于选股因子提取与收益预测,并通过多颗粒度融合技术提升投资组合收益表现。
核心论点与结论:
- 先前研究显示单颗粒度(如日度或小时级)深度学习因子已取得稳定且良好的业绩。报告进一步提出,同一特征在不同颗粒度下呈现的信息存在互补价值,单一频度的信息并非完全覆盖所有重要信号。
- 本文重点研究多颗粒度模型,包括“多颗粒度输入一次性训练”和“单颗粒度训练输出集成”两大类别,均能较单颗粒度提升Rank IC和年化超额收益,且输出集成方法效果最优,10日标签年化费前超额收益可达31.5%。
- 引入双向注意力GRU(AGRU)模型以缓解传统单向GRU的遗忘问题,效果显著,Rank IC和超额收益均稳步提升,其中Top10%组合费前超额收益达33%,Top100组合达40%。
- 微软亚研院提出的多颗粒度残差学习网络虽有创新理念,但本文复现效果未超越输出集成模型,提示模型超参数调优仍需深入研究。
- 基于多颗粒度深度学习预测,构建周度调仓的中证500和中证1000的AI增强组合,年化超额收益分别可达15%-20%和25%-30%,2023年YTD表现分别为10%-16%及15%-18%,成分股权重限制会使超额收益有所下降,但仍保持较高水平。
- 风险提示涵盖市场系统性风险、资产流动性风险、政策变动风险及因子失效风险,提示投资需关注宏观及市场环境变动影响。
[page::0,4,5,6,7,8,10,11,12,13,14]
---
2. 逐节深度解读
2.1 单颗粒度模型
关键内容:
报告回顾了前期使用单一频率(如日度、60分钟、30分钟)量价特征作为模型输入训练深度学习因子的研究结果,旨在比较不同颗粒度特征单独对模型表现的影响。
逻辑与证据:
通过对表1与表2的数据分析,发现基于日度特征训练的因子整体表现(尤其是年化费前多头超额收益)高于高频特征。然而,具体年度表现存在波动,如2017、2018年使用60分钟特征表现更优,2022年30分钟特征表现更好。这说明高频特征并非无增量价值。
关键数据点:
- 表1显示5日和10日标签下,日度特征的年化Top10%组合费前超额收益最高(如5日为30.3%),30分钟和60分钟特征有时次之。
- 表2年度细分显示,单颗粒度模型在不同年份对收益贡献呈现差异化,突出高频特征依然有可用信息。
预测与推断基础:
- 交易基于假设次日均价成交,交易成本双边千分之三
- 样本时期涵盖2017年至2023年7月的市场行情,反映长期稳定性
- 结论暗示不同时间尺度信息的互补价值,单一特征时间尺度存在局限。
[page::4]
2.2 多颗粒度模型
关键内容:
为解决单颗粒度模型信息覆盖不足的问题,作者设计了两类多颗粒度融合模型:
- 多颗粒度输入一次性训练:不同颗粒度特征分别通过独立GRU编码后输出结果合并,并由MLP生成最终预测。
2. 单颗粒度训练输出集成:对每个颗粒度特征分别独立训练预测模型,推理阶段简单平均或采用其他策略集成输出。
逻辑与证据:
表3中展示了在不同调仓频率和价格假设下,多颗粒度模型在Rank IC上均优于单颗粒度模型;表4进一步分年度显示多颗粒度模型超额收益更稳定,且输出集成表现最好,10日标签费前年化超额收益达31.5%。
关键数据点:
- 标签为5日或10日时,多颗粒度“输出集成”模型的Rank IC最高达到0.139-0.151,显著优于单颗粒度0.117-0.132的水平。
- 年度超额收益中,输出集成模型连续多年表现优异,提升幅度达3-5个百分点以上。
模型设计说明:
混合输入模型通过机制提升多频率信息融合效率;输出集成模型则从“模型多样性”获益,避免了单个模型误差的累积。
[page::5,6]
2.3 双向 AGRU 多颗粒度模型
关键内容:
在传统单向GRU基础上,结合注意力机制引入双向GRU,解决细颗粒度数据中序列信息容易遗忘的问题。所称双向AGRU模型,分别沿序列正反方向学习隐状态并引入注意力加权。
逻辑与证据:
图4及图5展示了双向AGRU单颗粒度模型相比传统GRU在不同频率的Top1%-Top100组合年化超额收益上均有明显提升。表5数据定量佐证,双向AGRU所有维度指标(Rank IC、ICIR、胜率、多头超额收益)均明显提升,费后超额收益平均上涨4%-5%。
在多颗粒度融合场景中,双向AGRU同样体现出更好的性能,图6、图7及表6显示包括混合输入和输出集成的双向AGRU模型在所有指标上均优于传统模型,Top10%和Top100组合费前年化多头超额收益分别达到33%和40%。
关键数据点:
- 对比GRU,双向AGRU单颗粒度5日日度特征费前超额收益从30.3%提升至34.2%(Top10%),Top100组合则从37.2%上升至41.5%。
- 多颗粒度输出集成-双向AGRU 5日标签费后超额收益达到24.0%-29.3%。
- 模型的周均Rank IC超过0.12,有效性稳定。
模型核心技术:
- 注意力机制实现对历史序列的加权采样,提升对重要信息的记忆能力。
- 双向GRU通过顺序及逆序处理特征,缓解常规单向GRU信息遗忘问题。
[page::6,7,8]
2.4 多颗粒度残差学习网络
关键内容:
借鉴微软亚研院提出的多颗粒度残差学习架构,将各颗粒度特征模块堆叠,通过残差学习机制去除前一颗粒度所覆盖信息,实现特有信息提取,最后集成各模块的预测结果。
逻辑与证据:
- 该架构旨在解决多颗粒度信息冗余高的问题,并动态判断各颗粒度特征对预测贡献。
- 具体由时序信息编码网络(双层GRU)、预测网络及细粒度重构网络三部分构成。
- 训练时引入重构损失项及L2正则。
- 本文仅复现日度及30分钟两颗粒度特征,实验表7显示残差学习网络在Rank IC、ICIR与超额收益均不及输出集成模型。
- 分年度超额收益图(图15、图16)表明残差学习模型在部分年份表现较好,但总体效果不稳,尤其2021、2022年表现较弱。
- 可能因超参数未充分调优导致表现未达文献报告水平。
[page::10,11]
2.5 AI指数增强组合构建
关键内容:
将双向AGRU多颗粒度模型的收益预测作为预期超额收益输入,构建周度调仓的中证500及中证1000 AI增强组合,实施风险控制,测试实际策略投资表现。
风险控制模块包含:
- 个股权重相对基准偏离限制(0.5%-1%)
- 因子暴露限制(估值、市值、中性/区间约束)
- 行业偏离控制(严格中性或不超过2%)
- 选股范围限制(如成分股权重限制80%)
- 换手率限制(单次单边不超过30%)
逻辑与证据:
表8-13详细列示不同模型、标签、风控参数下的组合年化及YTD超额收益。主要发现:
- 中证500增强组合在无成分股约束时年化费前超额收益15%-20%,2023年YTD10%-16%;加成分股权重约束后降至10%-15%,YTD7%-12%。
- 中证1000组合表现更佳,无约束年化收益达25%-30%,2023年YTD15%-18%;加成分股权重约束后收入降幅2%-3%,仍为22%-28%。
- 风控放松与标签长度调整均可提升超额收益。
- 中证1000区域策略持续表现优于中证500,反映高质量小市值股更适合深度学习模型挖掘。
风险收益特征(如表10、13):
- 超额最大回撤控制在5%左右,信息比率较高,月度胜率多次超过80%。
- 2021-2022年经历挑战期,但整体收益稳健。
[page::11,12,13]
---
3. 图表深度解读
图1 与图2:多颗粒度模型示意图
图1呈现“多颗粒度输入一次性训练”框架,三类不同频率特征先分开通过独立GRU模块学习序列信息,随后合并送入MLP实现输出。此设计保留各频率特征独特时间序信息,避免简单拼接信息混淆,兼顾信息融合。
图2展示“单颗粒度训练,输出集成”流程,同频率特征单独训练不同模型获得输出,之后通过简单平均等方式集成,有助于利用多模型集成优势降低过拟合风险。
[page::5]


图3:注意力机制示意
左图为传统GRU依序传递隐藏状态,右图引入注意力,聚焦历史各时刻隐藏状态,使模型动态权衡关键信息点,提高记忆能力。
[page::6]

图4、图5:双向AGRU单颗粒度模型超额收益
图4(Top1%)和图5(Top100)均展示双向AGRU模型超额收益显著高于传统单向GRU,进一步证明模型结构与注意力机制的提升作用,尤其在日度数据上表现最强。
[page::6]


图6、图7:双向AGRU多颗粒度模型超额收益
显示不同多颗粒度策略与基线相比,全线提升,输出集成伴随双向AGRU表现最佳,体现多层次信息融合及记忆机制的协同效果。
[page::7]


图8、图9:分年度超额收益稳定性
显示2017-2023年间双向AGRU多颗粒度模型Top10%与Top100组合年化超额收益较为均衡,无明显吞吐和衰减,2023年YTD仍保持正向收益,表明模型适应市场变化能力强。
[page::8]


图10:2023年Top10%组合累计超额收益曲线
展示近期策略收益的动态过程,包括两次较大回撤及随后快速稳健增长,反映实际投资的波动性与回撤管理。
[page::8]

图11、图12:不同选股空间模型表现对比
表明模型对市场不同分段表现差异较大,尤其全市场条件下表现最佳,中证800内表现相对较弱。流动性较好股票与中小盘股覆盖策略效果更佳。
[page::9]


图13:2023年不同选股空间YTD超额收益
突显沪深300表现优于上述其他区间,提示投资者组合拥挤效应和策略适配市场环境。
[page::9]

图14:多颗粒度残差学习网络结构
展示微软提出的残差粒度模块间信息过滤与集成机制,为提取多尺度特有信息设计的复杂架构,体现技术前沿思想。
[page::10]

图15、图16:残差学习模型分年度超额收益差异
表现优于输出集成模型仅在极少年份,整体未达预期,但验证了研究持续迭代的潜力。
[page::11]


图表吞吐分析总结
各图表充分支撑了本文提出的多颗粒度融合及双向注意力增强对于收益提升与模型稳定性的贡献,是理论与实证的有机结合及实践可行性的重要体现。
---
4. 估值分析
本报告属于策略因子研究类报告,不涉及传统意义上的公司估值与目标价,而是聚焦于量化模型选股能力、因子有效性及超额收益量化评估,核心“价值”体现在模型预测的选股能力与超额收益能力上,主要通过Rank IC、ICIR和多头组合年化超额收益进行评估。
主要评估指标及含义:
- Rank IC(秩相关系数):衡量预测收益排序与实际收益的相关性,反映模型预测能力。
- ICIR(Information Coefficient Information Ratio):Rank IC均值与波动率比率,指标越大模型稳定性与有效性越好。
- 胜率:模型预测的正确率。
- 多头超额收益:与市场平均水平相比的超额收益率,是因子及模型实际收益表现的最终体现。
无直接DCF、P/E等估值模型。模型估值可理解为对其构建投资组合预期回报和风险的综合反映。
---
5. 风险因素评估
报告列示的风险因素:
- 市场系统性风险:整体市场波动或系统性冲击可能导致模型失效或选股策略收益大幅波动。
2. 资产流动性风险:部分股票流动性不足或交易约束,降低模型预测因子的可实现性及策略执行效果。
- 政策变动风险:宏观政策或监管环境变化可能导致市场结构及股价行为变化,影响模型适用性。
4. 因子失效风险:因子本身可能因市场环境演变、投资者行为变化而失去预测能力。
潜在缓解措施:
- 风险约束融入投资组合构建,如行业中性、个股权重限制、换手率限制等,降低极端风险暴露。
- 采用多颗粒度及多模型集成分散因子失效风险,提高模型稳定性。
指标监控及动态调整是改善风险的常见方法,报告强调因素但具体缓解方案仍需结合实际投资策略实施。
[page::0,14]
---
6. 分析视角与细微差别
优点与创新点:
- 本报告深入探讨多颗粒度数据融合,具有前瞻性与技术创新含量,紧贴AI与深度学习前沿。
- 双向AGRU结合注意力机制有效提升长期依赖记忆能力,缓解传统RNN遗忘问题。
- 全面验证多频率特征增益,明确不同频率特征非完全冗余,体现实证严谨。
- 指标体系完整,业绩测算覆盖多年历史,具有良好说服力。
潜在局限与需要审慎对待的方面:
- 微软残差学习网络复现效果不佳,显示当前该网络架构及参数选择尚未成熟,需更多优化探索。
- 高频次特征融合引入的信息冗余及计算复杂度可能带来训练困难和过拟合风险。
- 数据频率与市场环境快速变化,模型在不同市场阶段的适应性及稳定性仍需持续验证。
- 报告主要聚焦于长历史表现,未详细讨论极端市场下模型失效的应对策略,风险披露较为宏观。
- 风控模块参数选择对结果影响较大,不同投资者需根据实际需求细化参数设定。
总体报告基于大量数据和严密论证,但建模和市场实践中的不确定性仍须关注。
---
7. 结论性综合
本研究通过对单独频率与多频率特征的深度学习因子训练和比较,验证了不同时间颗粒度量价信息的互补性及融合价值。多颗粒度模型,特别是输出集成方式,能显著提升模型的Rank IC及投资收益,同时兼顾信息稳定性和稀缺优势。双向注意力GRU的引入更是有效解决了传统RNN遗忘问题,提升了模型对重要历史信息的捕获能力。
虽然微软亚研院提出的残差学习网络具备先进理念,但复现效果尚未超越本文提出的融合方案,提示技术迭代仍在进行。基于双向AGRU多颗粒度模型构建的AI增强组合,在中证500和中证1000市场展现了优异且相对稳定的超额收益能力,多年表现持续优越,且风险暴露在可控范围内。
图表分析证明该模型不但能利用多级别时间信号,而且在不同选股空间的收益表现有显著差异,体现实际投资中频率选择和市场结构匹配的重要性。成分股约束对超额收益有一定抑制效果,但模型的优势依然突出。
鉴于报告权威背景、详实数据和创新模型方法,该研究为AI驱动的多频度量价信号融合投资策略提供了重要范式和实证支持,建议投资者密切关注多颗粒度模型在未来投资管理中的应用推进。
---
综述与评价
本报告系统探讨了深度学习选股因子构建中多颗粒度特征的价值,采用先进神经网络结构优化模型,并结合实证测试和综合风险控制,构建了具备稳定超额收益的实战型指数增强组合。它综合了模型原理、算法创新、量化财务指标和组合构建技术,是具备理论与实用双重价值的重要投资研究成果。
[page::0-14]
---
附录:数据和免责声明说明
报告末端详细展开了HSIPL及海通国际整体的合规信息、评级定义及分布、利益冲突声明、重要免责声明以及国际投资者须知等,保证报告发布的规范性、公正性和合规性,符合国际证券分析规范。
---
总结
本次对海通国际“多颗粒度特征的深度学习模型”报告的分析涵盖研究背景、方法论、模型创新、数据结果解读以及现实投资组合应用,结合详实图表及风险提示,展现了AI深度学习与多时间尺度信息融合在选股因子研究中的广泛应用前景及实践效果,极具学术和实务借鉴价值。
如需具体图表或表格深度解析,或模型算法细节进一步剖析,欢迎提出。