`

深度学习揭秘系列之二:涵盖价量与基本面因子的多模型结合神经网络

创建于 更新于

摘要

本报告基于多维因子集(量价因子、基本面因子及行情数据)构建了多模型神经网络框架,运用MLP与时序神经网络(RNN、GRU)结合多模型组合,研究不同因子预处理与神经网络结构对收益率预测的影响。报告指出量价因子和基本面因子需中性化处理以提升预测效果,提出单日量价因子用时序网络,窗口期因子用MLP的混合网络架构,实现5日及20日收益预测,构造混频因子提升预测稳定性。最终深度学习模型在行业轮动和指增组合构建中表现优异,5日混频因子年化超额收益达29.02%,20日达19.07%,行业轮动组合多头年化超额11.36% ,中证1000指增组合年化超额16.21% ,体现模型在实际资产配置中的应用价值与潜力[page::1][page::4][page::12][page::17][page::28][page::32][page::34][page::36]

速读内容


1. 量价与基本面因子预处理对模型预测影响 [page::11][page::14][page::15]

  • 量价因子预测原始和中性化收益率均表现良好,但输入中性化因子且输出原始值(方法C)风险指标表现较优。

- 基本面因子需中性化输入,因行业中枢差异显著,原始入力效果较差。
  • 量价因子和基本面因子中性化后结合,预测效果优于原始因子结合。


2. 多模型神经网络结构及因子结合表现 [page::17][page::27]

  • 采用多分支网络,低频量价因子和基本面因子用MLP,单日和高频量价因子及行情数据用GRU。

- 通过分支结构融合不同信号,构建多频率因子。
  • 5日合成因子年化超额收益27.14%,20日因子年化超额收益17.18%。


3. 时序神经网络参数调优及性能对比 [page::19][page::20][page::21]

  • MLP对量价窗口期因子表现稳定,层数2层,隐藏单元数约64-256之间较优。

- RNN对单日因子拟合优于GRU,大部分参数下RNN优于GRU,GRU对隐藏单元数敏感。
  • 单日因子用时序网络能提升预测效果,窗口期因子用MLP平衡效果表现和计算成本。


4. 原始行情数据时序学习表现及参数设置 [page::23][page::24][page::25]

  • 将7维行情数据(开盘价、收盘价等)经过标准化输入GRU,拟合效果优于RNN。

- 隐藏单元最佳在16-32,因行情数据噪音多需更复杂模型。
  • 行情GRU中性化因子5日调仓因子年化超额收益9.32%。


5. 混频因子构建及预测区间和调仓频率关系 [page::30][page::31][page::32][page::33]

  • 结合5日与20日合成中性化因子构造混频因子,5日混频年化超额收益29.02%,20日混频19.07%,均优于单一频率因子。

- 不同预测区间下因子表现集中在调仓初期,随时间表现衰减。
  • 高频调仓时短区间预测优势明显,低频调仓时区间差异影响小。


6. 应用示范:行业轮动与中证1000指增组合 [page::34][page::35][page::36]

  • 行业轮动组合基于深度学习模型预测构建,2014年至2024年10月多头年化超额收益11.36%。

- 中证1000指增组合基于中性化收益预测,月度调仓,年化超额16.21%,信息比3.64,表现稳健。

7. 关键图表展示

  • 图3:Alpha158量价因子MLP模型结构

  • 图6-8:基本面因子叠加效果、超额收益

  • 图9:时序+MLP混合神经网络结构示意

  • 图14-15:5日合成因子表现及多头超额净值曲线


  • 图22-23:行业轮动组合净值与超额表现


  • 图24:中证1000指增组合超额收益走势图


深度阅读

深度学习揭秘系列之二:涵盖价量与基本面因子的多模型结合神经网络——详尽分析报告



---

1. 元数据与整体概览



报告标题: 深度学习揭秘系列之二:涵盖价量与基本面因子的多模型结合神经网络
作者: 于明,周金铭
发布机构: 信达证券股份有限公司(金融工程与金融产品首席分析师团队)
发布日期: 2024年10月30日
主题: 本报告聚焦于金融量价因子和基本面因子的深度结合,运用包括全连接神经网络(MLP)、循环神经网络(RNN)及门控循环单元网络(GRU)在内的多模型融合方法,分析如何提升对A股市场股票未来收益率的预测能力。

核心论点与信息:
  • 通过对Alpha158量价因子及38个基本面因子构建多模型预测框架,深入探讨因子预处理(如中性化)对预测性能的影响。

- 采用参数遍历比较不同神经网络架构及其参数设置,结合传统量价特征与行情原始数据,打造高效的多模型组合。
  • 通过不同调仓频率与预测窗口的结合,形成混频因子,有效提升组合风险指标和超额收益表现。

- 最终构建的深度学习多模型组合实现了年化多头超额收益超过20%,显著优于传统基准组合。
  • 强调历史数据基础下模型存在失效风险的警示。

[page::0, page::1]

---

2. 章节详细解读



2.1 因子集、预处理与组合构建方式


报告首先定义了两大类关键因子:
  • 量价因子(Alpha158):158个基于价格和成交量构建的因子。涵盖单日因子(日内波动、价、量等指标)、以及窗口期因子(5/10/20/30/60日)。

- 基本面因子(38个):涵盖估值(EP、BP等)、质量(EPS、ROE等)、成长与分析师预期等维度。

关键预处理步骤:
  • 对因子极端值剔除,截面z-score标准化,是否进行市值行业中性化处理

- 标签为未来5日或20日的VWAP收益率(也有中性化版本)
  • 样本划分遵守防止未来数据泄漏的原则,训练、验证、测试集按时间顺序分

- 组合构建采用前10%因子值多头、后10%空头, 权重等权分配,剔除新股、ST股,交易成本纳入,且解决路径依赖问题通过多起点净值曲线归一化合成的方式降低偏差。
[page::5, page::6, page::9, page::10]

图1和图2形象说明了数据划分和路径依赖合并策略,确保模型评估结果稳健无偏。
图1
图2

---

2.2 三种中性化收益率建模方法对比


报告区分了4种代表性建模策略,定义编码为A、B、C、D,核心区别在于输入因子是否中性化,标签是否为原始收益排序或中性化收益,输出是否中性化处理。

表3清晰描述了这4种建模方式,实验对量价因子与基本面因子分别验证。
[page::11]

其核心发现:

- 量价因子(Alpha158):

  • 采用原始因子值预测原始收益(A方式)时,组合超额收益最高,但风险(波动率和最大回撤)亦最大。

- 采用中性化因子输入预测中性化收益(C方式)在收益与风险间较好平衡,尤其在模型IC(RankIC和ICIR)表现更稳定。
  • 输出端是否二次中性化(C与D方式)影响不大,因而建议采用“中性化输入,原始输出”的C方法。


表4和表5具体数据体现此逻辑,多个随机子集结合验证稳定性。
[page::12, page::13]
图3展示量价因子MLP网络结构。
图3

- 基本面因子:

  • 发现基本面因子强烈行业偏差影响模型拟合,未中性化的基本面因子造成预测效果显著下降。

- 中性化基本面因子输入大幅提升RankIC和ICIR指标
  • 同样采用C方式(中性化输入,原始输出)预测中性化收益。相关数据详见表6、7。

图4为基本面因子MLP结构。
图4
[page::14, page::15]

- 量价与基本面结合


通过分支神经网络实现量价因子与基本面因子的非线性融合,结果显示中性化基本面因子与原始量价因子结合提升效果更佳,IC和超额收益均显著提高,且在多阶段时间区间表现稳健。
表8至表9及图6、7、8直观呈现叠加效果。
图5
图6
图7
图8
[page::16, page::17, page::18]

---

2.3 时序神经网络应用及参数探秘



MLP与RNN、GRU横向对比:

  • MLP结构多参数遍历(表10、11)显示,隐藏层神经元设置遵循先大后小的降维思路最优。

- RNN与GRU在Alpha158完全因子集输入下,GRU没能显著优于RNN,且部分参数组合表现不稳定或退化(表12-13)。RNN的双层结构效果优于单层,而GRU差别不明显。
  • 推测因窗口期因子的重叠信息导致时序网络未充分发挥优势。


限定输入单日因子(13个)后,GRU优于RNN,且随着特征步长增大,预测效果递增,隐藏单元数适中最佳(表14-15)。
[page::19, page::20, page::21]

将单日因子通过时序神经网络,窗口期因子通过MLP结合,结果优于纯MLP(图9,表16、17),且参数经验更易总结。
图9

行情数据拟合

  • 以7维行情数据(开高低收价、成交额、成交量、VWAP)经标准化处理输入时序神经网络,GRU表现优于RNN,且步长越长效果越好(表18、19)。

- 行情数据需较多隐藏单元(16-32)以提取深层次信息,输入维度虽7个,但隐藏单元远超,体现行情数据噪声大,需更复杂模型。
  • 单边换手率较高,显著提升预测多头收益。

- 统计图11、12展现行情GRU模型优异的RankIC积累与净值超额表现。
图10
图11
图12
[page::23, page::24, page::25, page::26]

---

2.4 低频$+$高频量价$+$基本面因子$+$行情的四分支多模型组合



基于量价因子、基本面因子、行情数据和高频因子适用不同的神经网络模型特点,构建四分支网络模型协同训练(图13),预测未来5/20日收益。
[page::27]
图13

组合表现:
  • 5日合成因子年化多头超额收益达27.14%,RankIC15%以上,换手率合理(图14-15,表22-23)。

- 20日合成因子年化多头超额收益19.07%,RankIC近16%,换手率较低(图16-17,表24-25)。
  • 将5日和20日因子组合成混频因子,5日混频因子实现年化超额收益29.02%,RankIC13.8%,性能进一步增强(图18-19,表31-32)。

- 20日混频因子年化超额19.07%,提升显著(图20-21,表33-34)。
[page::28, page::29, page::32, page::33]

---

2.5 预测区间与调仓频率关系及行业轮动/指增组合应用


  • 分析预测区间(5/10/20日)与不同调仓频率下呈现的RankIC和超额收益,短期预测在高调仓频率下效果更佳,长期预测适合低频调仓(表26-29,页30-31)。

- 利用混频因子构建行业轮动组合,多空对冲,28个中信一级行业,选表现最优6个行业作为多头,得分最低6个作为空头,收益显著(年化超额11.36%,多空匹配带来22.71%超额)(图22-23,表35-36)。
  • 指增组合在中证1000成分股内选股,设置严格权重限制与调仓频率(月度),实现了超额收益16%以上,信息比3.64,风险调整后表现优异(图24,表37-38)。

[page::30, page::31, page::34, page::35, page::36]

---

2.6 风险因素评估


  • 报告明确风险提示:所有结论基于历史数据,模型在市场环境剧烈变化时可能失效。

- 投资者需意识到市场风险,模型效果无法保证未来表现。
[page::37]

---

3. 图表与表格深度解读


  • 图1、2:数据集划分及路径合并有效避免未来信息泄露,确保策略评估的公允性。

- 图3、4:展示MLP结构设计的清晰层级,分别针对高维量价因子与相对低维基本面因子设计,体现网络结构针对性。
  • 表4-7:系统对比因子中性化输入与标签定义,揭示因子分类型预处理对模型IC和组合风险的影响,指引因子预处理策略。

- 图5-8:分支式多模型架构验证补充型基本面因子提升效果,图表趋势清楚,表明中性化基本面因子对提升预测具有稳定贡献。
  • 表10-13:详细呈现MLP、RNN、GRU在量价因子不同参数设定下的表现,表明较深层RNN优于GRU的逆向发现,提示实际应用需具体问题具体分析。

- 表14-17 & 图9:单日量价因子与时序网络更适配,时序网络与MLP混合使用达到更佳预测性能。
  • 图10-12,表18-21:行情数据时序网络拟合效果可观,GRU表现突出,辅助选股因子提升因子组合性能。

- 图13:多因子多模型联动架构直观展现各分支网络和参数设置的融合。
  • 图14-21,表22-25, 31-34:合成因子、混频因子表现强化,年化超额收益与风险控制指标展现先进模型在组合管理的显著贡献。

- 图22-24及表35-38:行业轮动与指增组合分别基于深度学习模型的收益预测成功实现超额收益,具体数据量化了组合策略的风险收益特征。

---

4. 估值分析



报告并未提供传统意义上的公司估值分析,重点为因子构建、模型结构与金融机器学习预测性能优化,主要关注收益率预测精度及其对组合表现的影响。模型层面通过类似于IC(信息系数)、ICIR(信息比率)等指标衡量因子与模型输出与实际收益的相关强度。组合层面通过年化超额收益、风险(波动率、最大回撤)及风险调整收益率(波动比、回撤比)衡量策略效果。

---

5. 风险因素评估



唯一明示风险因素为基于“历史数据”进行模型训练和测试,若未来市场结构、行情环境突变,模型预测能力可能出现失效或显著衰减。这是机器学习选股模型最重要且普遍风险,需投资管理中不断监控与动态调整。

报告没有给出更详细的风险缓解策略,仅强调需谨慎应用。

---

6. 批判性视角与细微差别


  • 时序神经网络效果不一:GRU未必全面优于RNN,尤其在全因子集时,反映因果复合、信息冗余对复杂模型训练的挑战,显示模型架构需针对具体因子特色调整。

- 基本面因子中性化必要性强调:体现行业结构差异对多因子模型的显著影响,表明传统数据预处理在深度学习环节同样关键,简单“端到端”可能效果欠佳。
  • 回测样本时间跨度长,但部分年份(如2021、2022)回报波动较大,需警惕模型对不同市场环境的适应性。

- 换手率较高问题:部分日度调仓策略带来换手率和交易成本风险,虽考虑成本但长期稳定性和实际可操作性需进一步量化。
  • 风险提示较为简略,在回测表现优异与实盘复杂性之间尚存在鸿沟,投资者需理性看待。

- 报告中多次强调“中性化输入,原始输出”的策略,合乎实证统计优化与风险控制需求,但未详细阐述不同中性化算法对模型表现的影响深度。
  • 回测与实际执行路径依赖问题处理妥当,这体现作者对投资策略评估严谨性的重视。


---

7. 结论性综合



本报告系统深入研究了A股市场量价与基本面因子,基于深度学习多模型融合的预测体系构建与优化,涵盖因子预处理、模型选型、参数调优、组合构建与调仓策略,得出以下关键结论:
  • 量价因子与基本面因子需分别处理,基本面因子中性化处理显著提升模型预测能力,量价因子原始值与中性化值结合预测更优。

- MLP适用于窗口期量价因子;时序神经网络(RNN/GRU)适合单日量价及高频因子,且混合结构可取得较纯MLP显著提升。
  • 时序神经网络在行情原始数据上的应用显示了良好预测性能,GRU优于RNN,但参数敏感性较大,需谨慎设置。

- 多模型四分支融合架构显著提升综合因子预测效果,混频因子结合不同预测周期加强预测稳定性与泛化能力。
  • 基于深度学习预测构建的行业轮动组合、多空对冲组合,实现了超越市场基准的显著超额收益,表现稳健。

- 中证1000指增组合亦呈现突出风险调整后收益,证明策略对市值和风格中性化要求的应对能力。
  • 调仓频率与预测区间之间存在重要权衡,模型预测效果在调仓初期最高,后续递减,强调合适调仓频率选择。

- 报告高度强调“结论基于历史数据,市场环境变化可能导致模型失效”,提醒投资者风险意识。

本报告提供从因子构造、模型设计、训练验证到组合应用的完整深度学习选股框架,并使用详尽的数值与图形支撑论点,体现了定量投资的科研思维与严谨性。此外,对因子中性化预处理和时序现象的深刻洞察,为量化研究者和策略开发者提供了颇具价值的实践启示。

---

参考重要图表摘录


  • 图3 & 图4: MLP基础网络

- 表4-7: 不同输入输出处理对因子IC及风险影响
  • 图5-8: 量价+基本面融合效果明显

- 表10-17: 模型参数遍历细节与时序网络优劣对比
  • 图9 & 图10: 复杂网络结构示意

- 图14~21: 合成及混频因子表现
  • 图22~24: 行业轮动及指增组合实证表现

- 表26-29: 调仓与预测区间敏感度分析

(图片及全部表格请参照报告页码对应引用)

---

结束语



该报告通过多模型神经网络体系深刻解读量价与基本面因子间交互作用及时序关联特性,结合严密的数据预处理和稳健的回测框架,显著提升了A股市场股票收益率的预测准确度和策略表现。虽然面临模型参数敏感性与市场适应性风险,整体研究为深度学习应用于量化选股提供了有力样本和实践路径。

[page::0, page::1, page::2, page::3, page::4, page::5, page::6, page::7, page::8, page::9, page::10, page::11, page::12, page::13, page::14, page::15, page::16, page::17, page::18, page::19, page::20, page::21, page::22, page::23, page::24, page::25, page::26, page::27, page::28, page::29, page::30, page::31, page::32, page::33, page::34, page::35, page::36, page::37, page::38]

报告