`

深度学习因子库 多数据源、多网络因子合成

创建于 更新于

摘要

报告构建了基于多数据源(量价、基本面、一致预期、高频等)因子库,应用胶囊网络、VIT、深度残差网络、注意力机制、时空卷积等五种深度学习架构设计多模型,采用滚动训练与集成策略实现因子合成。模型IC值提升明显,集成模型夏普率稳定且年化收益优于单一模型,回测显示组合整体风险降低,收益风险指标具备较高的稳健性[page::0][page::8][page::9][page::11][page::12][page::15]

速读内容


量化投研模式演进与深度学习模型介绍 [page::2][page::3]



  • 量化策略由早期独立子策略合成转向因子-模型-组合优化的模块化模式。

- 深度学习模型(胶囊网络、VIT、深度残差网络、注意力集中网络、时空卷积神经网络)可有效提取高维非线性信息,支持多样数据输入形式。

深度学习模型核心结构示意 [page::3][page::4][page::5][page::6][page::7]






  • 胶囊网络:解决特征间位置关系问题,提升模糊数据鲁棒性。

- VIT模型:基于自注意力机制提取全局图像关系,适合大规模数据训练。
  • 深度残差网络:利用恒等映射解决深层网络退化。

- 注意力集中网络:引入多头注意力机制,改善长时序依赖问题。
  • 时空卷积网络:融合因果卷积与空洞卷积,实现高效并行计算与长时序建模。


因子来源及样本设计 [page::7][page::8]


  • 因子覆盖量价、财务、一致预期、逐笔(Level2)数据,丰富样本信息。

- 特征选择采用IC、IR、互信息等多维度标准。
  • 采用多周期、多标签、多Channel样本结构;

- 应用多种网络模型与结构组合,滚动训练并集成子模型输出。

模型表现及相关性分析 [page::9]


| 模型 | Model01 | Model02 | Model03 | Model04 | Model05 | 集成模型 |
|------------|---------|---------|---------|---------|---------|----------|
| 相关性范围 | 0.20~0.6| | | | | ~0.7 |
  • 各模型间相关性较低,表明多样化模型捕捉不同特征。

- 集成模型与单模型相关性约0.7,输出风格因子相关性较低。
  • 单模型IC表现明显,集成模型IC在所有周期均优于单模型,提升效果明显。


模型IC与IR表现详情 [page::9][page::10]

  • 1日IC最高单模型约0.049,集成模型1日IC为0.052,5-20日IC亦有提升。

- IR表现与IC趋势一致,集成模型IR接近最优单模型,波动性略增。
  • 年度IC表现有所衰减,集中在2018年之后,需关注模型稳定性。


回测表现及超额收益分析 [page::11][page::12][page::13]



  • 中证全指成分股作为股票池,2018-2022年回测。

- 组合每5日调仓,分5层分组市值加权。
  • Model01、Model04超额收益表现优异,集成模型超额夏普3.9左右。

- PortfolioIntegration集成方式风险最低,超额夏普达4.55,但年化超额收益非最高。
  • 多空组合中集成模型收益最高,约90%年化收益。


多模型净值与组合表现 [page::14][page::15]



  • 个别模型净值呈分组差异明显,分组1表现最佳。

- 集成模型净值曲线平稳,长期表现优异,展现稳定风险收益特征。
  • 回测年度超额收益及夏普率数据支持集成模型的稳健性提升。


风险提示与研究团队介绍 [page::0][page::15][page::17]

  • 量化因子有效性受市场变化影响,历史数据模型不保证未来表现。

- 深度学习模型可能存在过拟合及偏误风险。
  • 团队包含多位资深量化研究员,具备丰富机器学习和多因子实证经验。


深度阅读

证券研究报告详尽解读——《深度学习因子库——多数据源、多网络因子合成》



---

一、元数据与概览


  • 报告标题:深度学习因子库——多数据源、多网络因子合成

- 作者及联系方式
- 鲁植宸,邮箱:luzhichen@csc.com.cn,电话:15611537505,SAC执证编号:S1440522080005
- 研究助理:徐建华(xujianhua@csc.com.cn)、陈添奕(chentianyi@csc.com.cn)
  • 发布机构:中信建投证券股份有限公司

- 发布日期:2022年12月15日
  • 研究主题:报告关注基于深度学习的量化投研模式转型,围绕多数据源因子池,融合多种深度神经网络模型进行资产定价因子合成,构建高维且富含非线性特征的多因子模型库。

- 核心论点
- 早期量化投研受限于因子数量和线性模型,逐渐过渡到数据源丰富、资产定价进入高维非线性时代的模块化因子-模型-组合优化体系。
- 以多样深度学习网络(胶囊网络、VIT、深度残差、注意力机制、时空卷积)为基础,结合量价、基本面、一致预期和高频数据因子,构建多模型集成系统。
- 实验和回测显示,多模型集成在信息系数(IC)及收益稳定性方面优于单模型,尤其PortfolioIntegration组合带来风险显著降低,提升夏普比率。
  • 风险提示:模型可能存在计算误差且依赖历史数据规律,未来有效性存在不确定性和失效风险[page::0,15]。


---

二、逐节深度解读



1. 引言


  • 内容总结

- 传统量化投研基于数量有限的因子且采用线性加权,策略通常由多个独立子策略组合而成,体现为“子策略投研模式”——每个研究员管理独立因子库和模型,末端进行多策略组合(图表1)。
- 随着数据源的扩展(如一致预期、量价、新闻情绪、逐笔数据等),因子数量猛增,资产定价模型需进入高维非线性时代,研究者逐步采用因子-模型-组合优化的模块化投研模式,各子策略的因子合并形成共享因子库,并平行构建模型,最终集成组合(图表2)。
  • 逻辑与假设

- 因子从信号逐步演变为高维特征,单策略处理能力受限,模块化能高效融合多源信息和模型。
- 增加非线性模型如深度学习能够挖掘更复杂的资产定价关系。
  • 图表解读

- 图表1展现了研发现状的子策略分割架构,模型和因子库相对各自独立。
- 图表2展示了未来模块化模式下,将因子库合并,模型并行,最后进行集成优化,更具协同效应[page::2,3]。

2. 深度学习模型部分



本节介绍五种主流深度学习网络模型,说明其结构特点和技术优势。
  • 胶囊网络(CapsNet)

- 旨在解决卷积神经网络对局部特征空间关系捕捉不足的问题。
- 由多个“胶囊”组成,输出向量长度表示概率,方向编码物体姿态参数。
- 结构包括卷积层、PrimaryCaps和DigitCaps层(图表3)。
- 优点是更敏感于空间位置关系,能更好处理模糊和变形数据。
  • VIT模型(Vision Transformer)

- 将自然语言处理Transformer架构引入视觉任务,通过自注意力机制实现全局特征捕获。
- 把图像切割成16x16的patches,每个patch线性映射成固定长度向量,输入Transformer Encoder。
- 只使用Encoder部分,补充CLS Token。
- VIT模型保留空间信息,支持高质量特征学习(图表4)。
  • 深度残差网络(ResNet)

- 解决深层网络退化难以训练的问题,通过“跳跃连接”引入恒等映射分支,提升模型集中浅层与深层信息。
- 使网络训练更深层次且误差下降(图表5)。
  • 注意力集中网络

- 采用多头自注意力机制,摒弃传统RNN和CNN的序列对齐限制。
- 可减少信息遗忘和模型过度集中单点的问题,提升对长序列信息学习能力(图表6)。
  • 时空卷积神经网络(TCN)

- 基于因果卷积和空洞卷积,确保预测时仅使用历史信息并通过空洞卷积扩大感受野。
- 引入残差模块加快训练、避免梯度消失(图表7)。
  • 综合说明

- 本报告结合以上模型的优势,设计变种网络结构,旨在从多维度、多层次中提取因子与市场表现的复杂非线性关系,提升因子合成效果[page::3-7]。

3. 基于深度学习的因子合成



3.1 因子来源


  • 采用多数据源:

- 量价因子:基于价格、交易量构建的动量、波动率等反映投资者情绪和行为的因子。
- 财务因子:结合资产负债表、利润表、现金流量表数据及市场指标(EPS、市净率等)。
- 一致预期因子:利用分析师预期信息,充实特征维度。
- 高频Level2因子:基于逐笔成交及委托数据,对市场微观结构和资金流动性情绪建模[page::7]。

3.2 模型设计及训练


  • 特征工程

- 数据预处理:异常值处理,中性化,去量纲。
- 特征选择:基于IC(信息系数)、IR(信息比率)、互信息(MIC)等线性及非线性评价指标进行筛选。
- 构建多维样本结构:多周期、多标签、多Channel设计咀嚼多样特征模式。
  • 模型结构设计

- 几种深度学习模块(胶囊、VIT、TCN、Attention)融合,进行变种组合,针对性设计优化目标函数。
  • 训练流程

- 采用滚动训练方式,模拟真实预测场景,滚动预测输出结果。
- 子模型预测结果去量纲后进行集成,形成最终输出(图表8)[page::8]。

3.3 模型结果分析


  • 模型相关性分析

- 5个模型间相关性普遍低于0.5,表明模型挖掘的特征和聚焦信号具备互补性。
- 集成模型与单模型相关度接近0.7,显示综合优势(图表9)。
  • IC指标表现

- 单模型1日IC最高约0.05,5、10、20日IC最高达到0.08-0.1。
- 模型集成后各周期IC均高于单模型最佳,表明集成提升预测能力。
- IC逐年下降趋势显示市场环境可能导致因子表现波动或衰减(图表10)。
  • IR指标表现

- 反映信号持续性,单模型和集成模型表现相近,集成并未显著提升IR,但带来波动性增加(图表11)。
  • 回测结果

- 股票池定义为中证全指成分股,剔除ST、停牌等股票。
- 调仓频率为5天,通过因子层分组加权计算净值。
- 头部组合
- Model01和Model04超额收益和夏普较优,PortfolioIntegration组合夏普最高4.55,年化超额收益约27.67%(图表12、13)。
- 多空组合
- 集成模型年化收益最高约90%,明显超越单模型(图表14、15)。
- 单模型绩效分析
- 不同年份模型表现较为波动,集成模型稳定性较强,表现为每年排名靠前但非最好。
- Model04的IC增益主要源自尾部股票,集成模型改善收益区分能力及头部组合表现。
- 分组净值曲线(图表16~22)展示各模型及集成模型不同分组累计收益,验证分层表现稳健[page::9-15]。

---

三、图表深度解读


  • 图表1~2 子策略与模块化投研模式架构图

展示量化投研从传统的多子策略独立运行向统一因子库、平行模型、组合优化的结构转变,支撑报告核心思想[page::2]。
  • 图表3 胶囊网络模型结构

以二维卷积作为输入层,后续层为PrimaryCaps和DigitCaps,利用向量长度映射检测概率,强调空间特征关系捕捉,助力深层因子合成[page::3]。
  • 图表4 VIT模型结构示意

图像分Patch映射为序列,输入Transformer编码器模块,多头自注意力机制捕获全局信息,使得跨区域特征关联得到更好识别[page::4]。
  • 图表5 深度残差网络示意

展示跳跃连接结构,通过残差映射消除梯度消失问题,提高网络更深层表达能力,是因子复杂映射的基础工具[page::5]。
  • 图表6 注意力集中网络结构

Encoder-Decoder结构,多头注意力解决信息遗忘,增强长序列依赖捕获,适合高频序列数据的时序分析[page::6]。
  • 图表7 时空卷积神经网络结构

因果卷积确保预测时间限制性,空洞卷积扩大感受野,残差模块加速训练,优化长序列信息建模能力,有助于高频数据因子挖掘[page::7]。
  • 图表8 模型训练流程

因子库通过预处理、特征选择、多周期标签构造,输送到五种模型训练,子模型输出最终组合为统一预测,体现了多模型融合策略[page::8]。
  • 图表9 模型相关性热力图

各模型输出相关性低,模型与传统风格因子相关性弱,彰显深度模型挖掘的独特信号,集成模型相关性及表现具提升潜力[page::9]。
  • 图表10 各模型IC对比表

量化展示不同模型及集成模型在多个周期和年份的IC,集成提升稳定性和精度,但IC整体逐年下降,反映因子有效性受市场演化影响[page::9]。
  • 图表11 IR数据展示

单模型和集成模型IR表现相近,未体现集成提升,意味着信号稳定性未明显增强,波动有所升高[page::10]。
  • 图表12~15 各模型及集成模型回测表现

包含年化收益、夏普、波动率、最大回撤、超额收益等指标数据,实证模型集成在风险调整收益上具优势,尤其PortfolioIntegration显著降低整体风险,提高夏普[page::10-13]。
  • 图表16~22 各模型及组合净值曲线

详细展现各因子分层(5组)净值增减轨迹,集成模型净值曲线平稳且收益优于单模型,验证多模型融合带来整体性能提升[page::14-15]。

---

四、估值分析



报告主攻量化因子库和多模型合成,属于投研模型方法论层面,未涉及个股估值或行业估值,故无传统估值指标或模型(如DCF、P/E等)分析,侧重资产定价因子层面非线性映射与组合优化,不适用估值评估的传统框架[全篇无明显估值分析]。

---

五、风险因素评估


  • 因子有效性随市场风格变化风险

因子设计基于历史数据,市场由多种不确定性因素影响,不同周期、风格转换可能使得因子有效性波动或失效。
  • 模型拟合与历史依赖风险

机器学习、深度学习模型依赖历史数据训练,假定历史规律可持续,极端行情(如危机、黑天鹅)或风格突变可能破坏模型假设。
  • 模型计算偏误和不确定性

算法复杂,训练过程存在拟合偏误,预测中包含随机性,无法保证未来业绩表现。
  • 无明确缓解策略

报告未详述具体风险缓解措施,提示投资者需结合自身情况谨慎使用,风险自担。
  • 综述

风险提示充分反映了量化模型和深度学习方法的固有局限和应用边界[page::0,15]。

---

六、批判性视角与细微差别


  • 该报告采用了先进的深度学习技术融合多因子信息,架构和数据选择具有较强的前瞻性,但有几点须注意:

- 因子与模型的演变关系
- 因子由信号转变为高维“特征”,但报告未具体说明如何对因子进行经济学解释,可能导致模型“黑盒”问题。
- 模型集成虽提升IC但IR提升有限
- IC提升表明预测准确率增强,但IR即信号稳定性未改善,或显示模型在实盘中可能面临收益波动加剧风险。
- 市场环境影响大
- 多年回测中,模型IC逐年下降,说明历史验证虽充分,实际适用性存在约束,尤其极端行情尤需警惕。
- 无交易费用及流动性考虑
- 回测未计交易成本和滑点,模型实际经济收益率可能有所缩水。
- 缺少详实敏感性和稳健性检验
- 报告未详尽呈现参数调整或模型变动对结果影响,存在一定假设单一化问题。
- 图表9相关性表数据因排版问题部分难以完全解读,但总体结论一致
  • 这些因素需投资者在理解结果时保持适度谨慎并结合自身需求判断。


---

七、结论性综合



该报告系统性剖析了量化投研中深度学习模型应用转变,紧跟高维多源因子和复杂非线性资产定价需求,创新地采用胶囊网络、VIT、深度残差、注意力机制及时空卷积五类深度学习模型融合结构,基于全面的量价、基本面、一致预期及高频数据因子库,实现统一因子库下的模型平行训练及输出集成。

通过信息系数(IC)和信息比率(IR)分析,报告展示了模型集成大幅提升短中期预测的准确度和收益稳定性,尤其IC在所有周期表现均优于单模型。但集成未必提升IR,反映信号波动可能加剧。

实证回测涵盖头部组合与多空组合,多空策略年化收益率高达90%,头部组合年度表现稳定,通过模型集成显著降低组合风险,提高夏普比率,PortfolioIntegration组合夏普达4.55,风险调整效率明显提升。

模型的相关性分析显示各单模型间差异显著,集成提升了表达能力,且模型输出与传统风格因子相关性普遍偏低,表明其捕获了更多另类且有效的市场信号。

报告同时提醒因子与模型基于历史假设存在失效风险,市场极端变化和风格转移可能导致未来表现波动。投资者应审慎采纳该类方法,并注意现实操作中的交易费用、流动性等隐含成本。

总体而言,报告体现了深度学习在量化因子合成与资产定价领域的重要应用价值和实践潜力,为量化投研转型提供了系统性的技术方案和实证支撑,兼具理论前瞻性与实践指导意义[page::0-15]。

---

重要图表展示(部分)


  • 样例图表1(子策略投研模式):



  • 样例图表8(深度学习模型训练流程):



  • 样例图表13(头部组合净值):



  • 样例图表21(ModelIntegration净值):




---

结尾备注



该报告出自中信建投资深量化团队,作者鲁植宸是多因子与ESG策略研究资深分析师。团队结合前沿深度学习算法和丰富实盘投研经验,旨在推动量化投研科技进步。报告内容全面详实,适合深度参与量化策略开发、因子研究的专业人士阅读参考。

---

【本分析报告依据原文内容,逐段详解并溯源,确保内容准确全面,逻辑严密。】

报告