多模型学习量价时序特征
创建于 更新于
摘要
报告提出了以深度学习时序模型为因子单元,包括RESTCN(基于残差TCN卷积)和Transformer模型,结合LightGBM加权策略,构建AI量价选股策略。多模型融合后10日RankIC提升至16.5%,top组合年化超45%,且在不同换手率下均实现正收益,表现出显著的选股效果和稳健的风险控制能力[page::0][page::15]。
速读内容
1. 东方AI量价模型框架与方法创新 [page::3][page::5]

- 模型由输入数据、因子单元(神经网络提取alpha因子)和动态加权组合三部分组成。
- 因子单元采用长时间序列数据训练,结合短期树模型递归训练,实现长期有效且捕捉近效信息的因子打分。
- 本文扩展因子单元结构,引入基于 RESNET+TCN 的 RESTCN和基于 time2vec 时间编码的 Transformer编码器,提升因子多样性和信息提取效果。
2. 主流时序神经网络模型与因子单元设计 [page::4][page::6][page::7]




- RESTCN基于TCN网络,采用因果卷积和空洞卷积,并叠加一维残差卷积模块,强化局部量价序列特征提取。
- Transformer因子单元融合time2vec时间编码,并以多头注意力机制抽取序列长期依赖信息,输出结构设计允许充分利用所有时间步信息。
- 不同模型结构在提取alpha因子时具有差异性,有效降低直接相关性,提高信息多样性。
3. 因子单元模型实验效果比较 [page::8][page::9]
| 模型 | 5日无间隔RankIC | 10日无间隔RankIC | 20日无间隔RankIC | 10日间隔1日RankIC |
|-----------|-----------------|------------------|------------------|-------------------|
| GRU | 14.5% | 15.9% | 16.3% | 14.3% |
| AGRU | 14.5% | 16.0% | 16.6% | 14.3% |
| LSTM | 14.4% | 15.9% | 16.3% | 14.2% |
| RESTCN | 14.4% | 15.7% | 16.3% | 14.1% |
| Transformer | 14.6% | 16.1% | 16.7% | 14.4% |
- 各模型单独训练均展示显著的alpha信号,10日RankIC均超过15%,top组合年化对冲收益超过42%。
- RESTCN和Transformer与传统RNN模型在选股表现接近,但模型得分相关性较低,说明提取了较为差异的alpha信息。
4. 多模型融合策略及效果提升 [page::10][page::11]

| 整合方式 | 5日无间隔RankIC | 10日无间隔RankIC | 20日无间隔RankIC |
|---------|-----------------|------------------|------------------|
| RNN因子层面整合 (RNNv0) | 14.5% | 15.9% | 16.3% |
| RNN ZSCORE层面整合 (RNNv1)| 14.8% | 16.3% | 16.7% |
| RNN+RESTCN+Transformer因子层面整合 (RCTv0) | 14.6% | 16.0% | 16.4% |
| RNN+RESTCN+Transformer ZSCORE层面整合 (RCTv1) | 15.0% | 16.5% | 17.0% |
- ZSCORE层面整合优于因子层面,充分体现了多模型在滤噪和信息融合上的优势。
- 加入RESTCN和Transformer后进一步提升了多模型综合表现,尤其在2020年以来top组合收益显著提升。
5. TOP组合与增强组合实证表现 [page::12][page::13][page::14]

- TOP100组合在多种周换手率约束下均实现了稳定且显著的超额收益,周单边5%换手仍有20%以上的超额。
- 增强组合在沪深300和中证500均展现良好年化对冲收益和风险控制,成分股约束对组合效果影响有限。
- 组合回撤得到有效控制,费后组合收益保持正向增长。
6. 结论与风险提示 [page::15][page::16]
- 通过深度时序学习模型RESTCN、Transformer的引入,量价alpha因子提取能力得到增强。
- 多模型ZSCORE层面融合机制效果优于单一模型及因子层融合,top100组合持续正收益,换手率灵活。
- 风险点包括量化模型潜在失效和极端市场冲击风险,建议投资者密切关注模型表现和市场环境变化。
深度阅读
多模型学习量价时序特征报告详细分析
---
一、元数据与报告概览
- 报告标题: 多模型学习量价时序特征 — 因子选股系列之八十三
- 发布机构: 东方证券研究所
- 发布日期: 2022年6月12日
- 证券分析师: 朱剑涛(执业证书编号:S0860515060001)、王星星(执业证书编号:S0860517100001)
- 研究主题: 基于深度学习时序网络的量价因子模型构建与多模型融合策略的优化应用,应用于周频调仓的A股选股策略研究。
核心论点概述:
报告在先前已有的AI量价因子模型架构基础上,针对因子单元时间序列模型部分,融合了深度学习领域的先进方法——一维卷积网络(CNN,特别是RESTCN模型的一维残差时间卷积网络)与Transformer(引入time2vec时间编码的Transformer encoder结构),以期提取更多元且差异化的alpha因子,强于传统RNN模型(如GRU、LSTM)。
两种多模型整合方式中的zscore层面整合多模型效果明显优于因子层面整合。实验表明,结合RESTCN和Transformer模型,综合打分的10日RankIC平均达到16.5%,top组合年化收益达45.7%,且换手适度控制下收益稳健,可支持多种组合规模应用。
---
二、逐节深度解读
1. 东方AI量价模型概述
- 描述了基于神经网络与机器学习的量价因子模型架构(图1所示),分输入数据、因子单元、因子加权三部分。
- 输入数据为原始量价序列及人工提取的特征序列。
- 因子单元使用长时间序列训练,提取深层alpha信息,防止过拟合。
- 加权模型采用短周期训练的树模型以捕获因子时效性,动态加权,实现长期有效且近期有效因子的结合。
- 该结构能降低过拟合风险并保持对alpha变化的灵活响应。
其中,因子单元是选股的核心模块,负责对时间序列式的量价数据建模,先前使用的模型为RNN系列(GRU、AGRU、LSTM)[page::3]。
2. 因子单元网络结构
2.1 时序网络研究现状
- RNN(特别是门控型如LSTM、GRU)擅长序列数据建模但存在梯度消失爆炸问题,注意力机制为其提供改进方向。
- CNN一维卷积通过因果卷积和空洞卷积实现防止未来信息泄露和扩大感受野,TCN模型效果优于传统LSTM。
- Transformer模型使用注意力机制,需通过位置编码引入顺序信息,虽计算复杂度高,但在多个领域表现出色,多种Transformer变体优化了其不足。
- 实际时序任务中,网络结构多为RNN、CNN、Transformer的融合,如Temporal Fusion Transformer等[page::4]。
2.2 本文网络结构
RESTCN因子单元
- 基于Bai Shaojie(2018)的TCN结构,采用因果卷积避免未来信息,使用空洞卷积扩展感受野。
- 本文在TCN底层进一步嵌入3层64通道的一维卷积残差块(ResNet结构),以增强模型对局部量价特征的学习(图3)。
- TCN输出为时间序列,因因果卷积只有最后时间步整合所有信息,模型输出取最后时间步作为Alpha因子。
- 图2详示TCN因果卷积和残差块结构,图3展示RESTCN整体结构设计[page::5][page::6]。
Transformer因子单元
- 采Vaswani(2017)Transformer Encoder结构,引入time2vec时间编码(Kazemi,2019),用拼接方式代替加法整合位置编码,周期性保留正弦函数形式。
- 为充分利用每个时间步信息,将各时间步输出用时间线性层汇总,再与最后一步输出拼接,经过线性映射导出Alpha因子(图4)。
- 使用多头注意力机制核心结构如图5所示,实现了对序列信息的深度学习。
- 该设计改善了传统Transformer缺少直接时间属性编码的缺陷,适合金融时间序列中复杂时序特征捕获。
总结,RESTCN结合TCN的长短期信息建模优势与ResNet局部特征提取能力,Transformer利用强大注意力机制与time2vec实现高效时序学习,形成两种互补且表现优秀的因子单元结构[page::6][page::7]。
3. 模型实验结果
3.1 实验说明
- 样本空间为2016-12-30至2022-05-31的中证全指成分股。
- 模型分别对三种量价序列(rawbar、mschars、l2chars)训练,产生因子后用LightGBM进行加权得分。
- 评价指标为RankIC(5日、10日、20日无间隔及间隔1日)、ICIR及分组业绩等。
- 交易采用周度调仓,次日vwap成交,未计交易成本,但有换手率披露。
- label设置为T+1收盘至未来连贯区间的涨跌幅。
3.2 各模型选股效果
- GRU、AGRU、LSTM三种RNN模型及新增RESTCN和Transformer的10日RankIC均在15.7%-16.1%浮动,选股效果趋同(详见图6)。
- ICIR数据表明RESTCN与Transformer略优于RNN(图7)。
- 分组年化对冲收益(2017年至今)top组合均超过42%,2020年后虽有小幅回落但仍获超额收益(图8、图9)。
- AGRU虽引入注意力但未明显超越GRU;RESTCN和Transformer尽管架构差异大,成绩与RNN相当,说明基础量价信息捕捉能力饱和。
- 不同模型得分间相关性分析显示,RNN模型内部相关系数高(~94%),而RESTCN和Transformer与RNN相关性略低(~90%),体现模型结构差异带来一定信息多样性(图10、图11)[page::8][page::9]。
4. 多模型整合方式
4.1 整合方法
- 因子层面整合:将不同模型生成的alpha因子拼接后输入加权模型。
- zscore层面整合:对每个模型alpha因子单独加权生成综合打分zscore,再对多个模型的zscore进行等权汇总。
数学解析表明,若单模型IC期望相等且彼此相关性一致,多模型之平均IC期望按相关系数调节有明确界限。此解释了为何同一模型多次训练平均能提升表现,以及多模型整合的理论基础。
4.2 整体选股效果对比
- zscore层面整合优于因子层面整合,可能因后者对加权模型去冗余能力要求更高。
- 引入RESTCN与Transformer后,整体选股表现(RankIC、IC_IR、top组合收益)均有所提升。
- RCTv1(五模型zscore整合)10日无间隔RankIC达16.5%,top组合年化收益达45.7%(图12-15)[page::10][page::11]。
5. TOP组合与增强组合表现
5.1 组合测试说明
- 周频调仓,次日vwap成交,买卖成本分别为千分之一和千分之二,考虑涨跌停及停牌限制。
- 换手率用delta(约束值)和avgto(实际)指标衡量。
- 增强组合采用风格和行业因子暴露约束(风格因子不超0.5,相对行业因子不超2%)、跟踪误差被限制(沪深300不超4%,中证500不超5%)。
- 测试区间为2017-01-01至2022-06-01。
5.2 TOP组合业绩
- TOP100组合在不同换手约束下年度表现稳定,低至周单边5%换手仍实现逾20%超额收益。
- TOP300组合容纳资金容量较大且收益略降,回撤更小,适合规模较大的投资者(图16-17)。
- 净值曲线(图12页)显示组合净值稳健且最大回撤受控。
5.3 沪深300增强组合
- 成分股80%约束下,增强组合效果优于无约束,年化对冲收益超过11%,波动率和最大回撤保持合理区间。
- 低换手策略(周10%)费后收益不逊于高换手,具备良好交易弹性。
- 报告指出该模型打分可作为alpha因子嵌入传统多因子模型,增强多因子体系(图18-19)[page::13]。
5.4 中证500增强组合
- 无约束增强组合收益更高,但跟踪误差稍大,带来信息比率略逊于成分股80%约束组合。
- 在不同换手率下组合费后业绩均较为稳定,近年波动性有所增加,但年初表现超额显著(图20-21)[page::14]。
---
三、图表深度解读
- 图1(东方AI量价模型框架)
说明模型从底层多个频率的原始及衍生量价序列出发,经多个因子单元(神经网络模型)提取因子,最后动态加权,形成统一的选股打分,兼具长短期特征学习的优势[page::3]。
- 图2(TCN模型架构)
展示因果卷积结构保证预防未来信息泄漏,空洞卷积增加感受野,残差结构辅助深层训练。
模型设计利于捕捉长短期时序信号[page::5]。
- 图3(RESTCN网络结构)
RESTCN嵌入3层64通道一维卷积残差块于TCN底层,以增强本地量价特征提取能力。输出选取最后时间步集成信息,形成最终因子[page::6]。
- 图4(Transformer因子单元架构)
结合time2vec时间编码任意时间信息编码,通过多头注意力及残差模块捕获复杂时序依赖,采用线性层对所有时间步输出做融合,充分利用序列全部信息[page::6]。
- 图5(Transformer多头注意力结构)
详细绘制多头注意力计算流程,核心为Scaled Dot-Product Attention,融合多个注意力头,捕获复杂时间序列关联性[page::7]。
- 图6-9(模型RankIC及Top组合收益)
各模型10日RankIC均在15%-16%稳定区间,Top组合收益表现均十分显著,赎回显示,RESTCN、Transformer性能并不逊色于RNN(且在某些指标略优)[page::8][page::9]。
- 图10-11(模型得分相关系数)
反映了模型间及模型多次训练的得分稳定性和相关性,支持了多模型融合提升信息多样性的理论基础[page::9]。
- 图12-15(多模型整合方案效果比较)
Zscore层面整合同因子层面整合的优势明确,且模型差异化(添加RESTCN/Transformer)提升整体RankIC及组合收益,强化模型融合策略合理性[page::10][page::11]。
- 图16-21(TOP组合及增强组合业绩)
详细数据显示不同换手、不同组合规模下收益与回撤指标,结合换手灵活控制,验证了模型在实际交易条件下的良好应用价值和稳健性[page::12][page::13][page::14]。
---
四、估值与风险评估
本报告主要为因子模型和策略构建的研究报告,不涉及直接的企业估值分析,故无估值模型与目标价。
风险提示:
- 量化模型失效风险: 由于模型建立基于历史数据及训练,未来市场结构变化或极端条件可能导致模型效用下降。
- 市场极端环境冲击: 残酷市场波动可能显著影响策略表现,带来潜在较大亏损。
报中未具体提供风险缓解方案建议,但通过动态加权及模型多样化整合方式间接提升稳健性[page::0][page::16]。
---
五、批判性视角与细微差别
- 报告明确了不同模型结构间alpha信息重叠度较高,融合收益提升有限,上层因子加权模型对冗余信息的容忍度和处理能力是融合策略关键限制因素。
- AGRU引入注意力机制,但未显著超越传统GRU,提示特定结构改进不一定带来显著收益,实际效果需结合业务场景和模型复杂度权衡。
- 多次训练提升结果稳定性,也说明单次训练随机性较大,模型训练稳定性为后续优化的重要方向。
- 整合模型在当前LightGBM加权基础下效果最佳,未来若采用其他更强模型,因子层面整合可能更具潜力。
- 本报告数据期限至2022年5月,某些最近市场极端情况未能充分反映,模型在后续极端环境下表现待观察。
- 组合回撤指标虽未极端,但顶峰回撤仍超过20%,实际策略使用需结合风险承受度调整参数。
---
六、结论性综合
本报告基于东方证券量价时序量化策略框架,深化了因子单元神经网络结构的多样化研究,通过引入RESTCN(基于增强型TCN与残差结构)与Transformer(基于time2vec时间编码的encoder结构)模型,成功实现对量价序列深度学习的多样化与增强。实验表明,这两种新模型在单模型选股效果方面与传统RNN不相上下,均表现出优异的10日RankIC水平(约16%),同时还可提供有益的信息差异。多模型融合策略上,报告创新性地对比因子层面与zscore层面两种整合方法,发现zscore层面整合能更有效地利用多模型信息,提升加权性能,最终带来综合RankIC提升至16.5%,并使top组合年化收益达到45.7%,表现稳健且换手适中时依旧优异。
在实际组合性能上,不论是TOP100、TOP300组合还是沪深300与中证500的增强组合,均实现了经历2017年以来多轮市场震荡考验的正收益和合理回撤水平,在换手灵活限制下兼顾收益与交易成本。图表数据细致展现了策略收益和风险指标,验证了模型实用价值。同时,报告强调了模型失效及市场极端风险,提示投资者需持续监控。
整体来看,报告体现了东方证券在利用深度学习先进技术提升量价因子挖掘及选股策略构建上的前沿探索,结合严谨的实证检验与多角度性能评估,为量化投资策略提供了坚实的研究基础和应用经验,具有较高的理论价值和实务指导意义[page::0][page::3][page::6][page::8][page::10][page::12][page::15]。
---
# 本次分析完毕。