海通金工 |选股因子系列研究(九十七) 使用图神经网络融合量价信息与基本面信息
创建于 更新于
摘要
本报告基于深度学习框架,探讨基本面信息与量价信息的融合路径,测试采用二次加权及图神经网络(GAT)技术。研究发现单纯简单合并难以提升模型表现,二次加权虽提升基本面信息融入但回撤控制仍有不足,图神经网络模型(BiAGRU-GAT)有效改善了基本面信息的学习能力并显著提升2024年以来超额收益表现,同时实现更低的超额回撤和更稳定的选股能力,验证了图神经网络在量价与基本面融合中的优越性,为智能选股因子构建提供了创新思路 [page::0][page::1][page::3][page::5][page::7][page::8]
速读内容
- 深度学习基本面因子表现 [page::1][page::2]

- 基于历史12个季度基本面特征训练的深度学习因子具有一定选股能力,周均Rank IC约0.039,月均约0.067,Top 10%组合超额收益约10%。
- 简单将基本面特征与量价特征共同输入模型,模型对基本面信息学习有限,复合因子与基本面因子相关性仅小幅提升。
- 二次加权模型融合基本面因子 [page::3][page::4]

| 模型名称 | Rank IC (TO收盘) | Top10%超额收益(费前) | Top10%超额收益(费后) | Top10%年化双边换手 |
|---------------|------------------|---------------------|---------------------|--------------------|
| 基准模型 | 0.140 | 32.6% | 24.5% | 42倍 |
| 二次加权模型 | 0.133 | 32.1% | 22.2% | 52倍 |
- 二次加权模型周度选股能力显著,年化超额收益32.1%,但换手率提升至52倍,表现出更频繁调整。
- 与基本面因子盈利、成长、SUE关联度更高,2019、2020及2024年表现优于基准,2022及2023年略逊于基准。


- 图神经网络(BiAGRU-GAT)模型设计与表现 [page::4][page::5][page::6]

- 采用GAT实现基本面信息的图结构聚合,结合BiAGRU提取时序量价信息,实现信息间动态权重调整。
| 模型名称 | Rank IC (TO收盘) | Top10%超额收益(费前) | Top10%超额收益(费后) | 因子值自相关性 | Top10%年化换手 |
|------------|------------------|---------------------|---------------------|---------------|----------------|
| 基准模型 | 0.140 | 32.6% | 24.5% | 0.74 | 42倍 |
| BiAGRU-GAT | 0.141 | 32.9% | 23.9% | 0.74 | 47倍 |
- BiAGRU-GAT模型周度Rank IC最高,年化多头超额收益32.9%,且2024年超额回撤明显低于基准和二次加权模型。

- 模型与基本面因子(EP、盈利、成长、SUE)相关性提高,2023年底与市值相关系数从-0.40降至-0.19,降低市值偏离。


- AI增强组合实证 [page::6][page::7][page::8]
| 模型名称 | 中证500(全市场)年化超额收益 | 中证1000(全市场)年化超额收益 |
|--------------|-----------------------------|------------------------------|
| 基准模型 | 15.9% | 21.7% |
| 二次加权模型 | 13.1% | 19.7% |
| BiAGRU-GAT | 17.2% | 24.1% |
- BiAGRU-GAT模型全市场中证500增强组合2024年以来超额收益4.2%,最大回撤5.6%;中证1000组合超额收益高达24.1%,最大回撤5.0%。
- AI增强组合回撤控制更优,表现更稳定,2024年策略回撤明显小于基准。


- 风险提示 [page::7]
- 市场系统性风险
- 资产流动性风险
- 政策变动风险
- 因子失效风险
深度阅读
海通金工选股因子系列研究(九十七)——使用图神经网络融合量价信息与基本面信息详细分析报告
---
1. 元数据与概览
- 报告标题:《海通金工 | 选股因子系列研究(九十七) 使用图神经网络融合量价信息与基本面信息》
- 作者:郑雅斌(海通金融工程首席分析师)
- 发布机构:海通证券研究所
- 发布日期:2024年5月13日
- 研究主题:本报告重点探讨了如何通过图神经网络技术更有效地融合股票的基本面信息和量价信息。研究属于量化选股因子构建的技术前沿,侧重于深度学习模型和图神经网络(GNN)在因子挖掘与资产配置优化方面的应用。
- 核心信息与目的:
- 基于深度学习模型,单独使用基本面信息或量价信息都可挖掘有效选股因子,但简单将两类信息合并输入模型效果有限。
- 文章尝试两种改进方式:二次加权(基于XGBoost)和图神经网络(GNN),后者形成的BiAGRU-GAT模型表现最佳。
- BiAGRU-GAT模型在提升基本面信息的融入度,同时保持或提升选股能力及风险控制方面均显著优于基准模型和二次加权模型。
- AI增强组合(基于该模型构建)在中证500和中证1000指数增强测试中表现卓越,2024年展现出明显更稳健的绩效。
- 主要结论:图神经网络能够有效地融合基本面与量价信息,使得深度学习模型选股因子表现更优,投资组合风险回撤小,收益稳定且超额收益显著。[page::0,1,2,3,4,5,6,7,8]
---
2. 报告逐节深度解读
2.1 投资要点与研究动机
- 内容总结:报告从之前系列报告着手,指出单独使用深度学习模型提取的量价因子具备强选股能力,基本面因子也能被深度学习模型有效挖掘,但二者简单合并时模型未能充分学习基本面信息。
- 核心问题:为何基本面信息与量价信息的直接合并未提高模型表现?假设为两类数据之间相关性较低,导致模型难以平衡学习。
- 创新点:探索“二次加权”和“图神经网络”结构用于更有效地融合两类信息。
- 定量表现:深度学习基本面因子周均Rank IC在0.039左右,虽低于量价因子,但表现不容忽视;Top 10%组合超额收益约10%[page::0,1]
2.2 基础测试:简单深度学习模型融合基本面信息
- 设计:仅使用过去12季度基本面特征训练GRU+MLP架构的模型,单独测试基本面因子能力;再将基本面+量价特征合并输入模型测试“复合因子”。
- 发现:
- 基本面因子选股能力确实有效,但与量价因子刻画的市场信息尚有差距。
- 复合因子几乎与量价因子表现同质化,显示简单拼接不足以提升基本面信息权重。
- 表1详解:
- 不同调仓周期中,量价因子5日Rank IC约0.139,复合因子略优(0.140),基本面因子Rank IC明显偏低(0.039)。
- Top10%组合费前超额收益,量价因子约32.6%,基本面只有10.4%,复合因子32.2%。表明残差信息较少。
- 表2相关性分析:
- 基本面因子与BP、EP、盈利、成长、SUE(事件盈利意外)等基本面常规因子正相关性明显。
- 复合因子相比量价因子没显著增强与基本面因子的相关度,暗示模型未能充分融合。
- 推断:基础深度学习架构无法有效整合两类不同数据特征的原因,包含数据的周期性差异(基本面周期长,量价周期短)和信息结构差异[page::1,2]
2.3 二次加权模型融合基本面信息
- 思路:基于对量价信息训练的32个深度学习因子,结合传统基本面因子进行二次加权(以XGBoost作为融合模型),不直接拼接特征,而是结果级融合。
- 流程:详见图1,量价特征先以BiAGRU训练,得到多个量价因子;再与基本面因子输入XGBoost,得到最终因子。
- 表3表现:
- 周度Rank IC略降至0.133(基准模型0.140),费前Top10%收益略降至32.1%。
- 换手率提升显著(42倍到52倍),反映交易频繁,可能因二次加权使因子更灵活。
- 图2&3关联性:
- 二次加权模型与盈利、成长、SUE等基本面因子相关性明显更强。
- 与基准模型类似,仍偏向小盘、价值、反转、低波动和低流动性股票。
- 表4分年度收益:
- 二次加权模型在部分年份(2019、2020、2024)优于基准模型,但2022和2023年表现不佳。
- 图4净值走势:
- 2024年初二次加权模型出现大幅回撤,接近基准模型,随后回升更快。
- 总结:二次加权能实现基本面因子的有效融入,但年份表现不稳,且换手率较高,交易成本需关注[page::3,4]
2.4 图神经网络融合基本面信息(BiAGRU-GAT模型)
- 科学背景与建模思路:
- 股票间基于基本面构建关联图,利用图神经网络(GNN)中的Graph Attention Networks (GAT)对因子进行微调,动态调整相关股票对个股评分的影响。
- 这样,量价信息得分被基本面联系的邻居股票进行影响,实现“图结构信息融合”。
- 建模流程:图5示意图,量价信息先经BiAGRU提取时序特征,再传入GAT利用基本面关联信息修正,形成终端因子。
- 表5模型表现:
- Rank IC达0.141,费前Top10%超额收益32.9%,表现优于基准模型及二次加权模型。
- 换手率略升至47倍,稳定性有所提升。
- 表6分年度收益:
- 在2017、2018、2021及2024年优于基准模型,并且2024年初取得12%的明显超额多头收益。
- 图6净值表现:
- 2024年初比基准模型回撤明显更小,收益更稳定。
- 关键指标关联性(图7,8,9,10):
- BiAGRU-GAT模型与EP(收益率估值)、盈利、成长、SUE等关键基本面因子相关性更高。
- 与市值和中盘因子相关性减弱,意味着模型减少了对规模效应的依赖,提升估值与盈利驱动特征。
- 总结:图神经网络通过股票间基本面关联,动态加权,显著提高选股能力及投资组合稳定性,提升因子与基本面指标的吻合度,降低了规模效应干扰[page::5,6]
2.5 AI增强组合验证
- 组合构建:基于上述模型因子预测收益,结合中证500和中证1000指数,分别构建全市场和成分股80%覆盖的增强组合。
- 风控约束:权重偏离、估值中性、市值中性、行业中性、换手率限制等多维度限制,模拟实际交易环境,最大化预期收益。
- 表7年化超额收益比较:
- BiAGRU-GAT模型中证500增强组合年化超额收益最高,达17.2%。
- 中证1000增强组合年化超额收益最高达24.1%,均优于基准和二次加权模型。
- 表8(500增强)和表9(1000增强)风险收益特征:
- BiAGRU-GAT整体信息比率更高,月度胜率更稳定。
- 超额最大回撤显著小于基准模型,尤其在2024年表现突出(500增强组合最大回撤仅5.6% vs 11%)。
- 图11、12超额净值走势:
- 2024年初回撤阶段,BiAGRU-GAT组合净值降幅明显小于基准,强调模型抗风险能力。
- 结论:图神经网络驱动的因子模型在实战环境中展现了较为稳健与卓越的投资表现,兼顾收益和风险控制[page::6,7,8]
2.6 总结与风险提示
- 总结:
- 深度学习模型可从基本面提取有效选股因子,但简单融合有限。
- 二次加权与图神经网络是有效融合量价与基本面信息的方法,其中BiAGRU-GAT表现最佳。
- BiAGRU-GAT模型在增进基本面信息融入的同时,选股绩效和风险调整能力均优于传统基准。
- 风险提示:市场系统性风险、资产流动性风险、政策变动风险、因子失效风险可能影响模型表现。
- 版权及免责声明:报告中观点仅供专业投资者参考,非投资建议,投资有风险需谨慎。[page::8,9]
---
3. 图表深度解读
表1 深度学习因子选股能力 (2017.01-2024.04)
- 展示内容:量价、基本面、复合深度学习因子在不同调仓周期(5/10/15/20天)的Rank IC(选股能力指标)、Top 10%与Top 100超额收益(费前与费后)。
- 解读:量价因子无论哪个调仓周期都有更高IC(最高达~0.167),基础面因子IC约为0.039~0.067。复合因子表现接近量价因子。说明基本面信息有效但融入模型后未能显著改善模型表现。
- 结论:基础面因子具备选股价值,但需更高效融合策略以发挥优势。
表2 深度学习基本面因子相关性对比
- 展示内容:三类深度学习因子(量价、基本面、复合)与传统因子(市值、中盘、BP、EP、1个月动量、流动性、波动率、盈利、成长、SUE)截面相关系数。
- 解读:基本面因子与盈利、成长、SUE正相关明显;量价因子与流动性正相关较强;复合因子相关性与基本面略有提升但不明显。
- 结论:融合不足,复合因子仍主要反映量价信息。
图1 二次加权模型流程
- 量价信息先经BiAGRU提取深度量价因子,基本面信息通过人工逻辑转换为基本面因子,两者在XGBoost模型中融合加权,形成终端因子。
表3 二次加权模型选股能力对比
- 关键数据:模型的Rank IC轻微下降但Top10%费前年化超额收益仍达32.1%,基本持平。换手次数由42倍提升到52倍,交易活跃度增加。
- 结论:基本面信息注入带来了交易频率增加的副作用,但选股效果总体保持。
图2 & 图3 截面相关性对比
- 图2显示二次加权模型相较基准模型更偏价值、盈利及成长因子;图3表现二次加权模型基本面因子相关性(盈利、成长、SUE)显著改善。
- 说明二次加权策略强化了基本面影响力。
表4 分年度多头超额收益
- 主要趋势:二次加权模型在部分年份(特别是2019、2020、2024)跑赢基准模型,但2022-2023年表现弱于基准。
- 说明:基本面信息的价值受市场阶段影响,量价信息在不同年份影响力不同。
图4 超额净值走势(2024.01-2024.04)
- 二次加权模型走势较基准模型更为平稳,但在2月初仍出现显著回撤。
图5 BiAGRU-GAT模型流程
- 量价信息经BiAGRU提取时序特征,后通过GAT利用基本面构造的图结构进行动态调整,输出最终因子。体现了“信息图谱”结构学习。
表5 BiAGRU-GAT模型周度选股能力
- 关键指标Rank IC提升至0.141,Top10%费前超额收益为32.9%,换手率47倍适中。
- 明显优于基准和二次加权模型。
表6 BiAGRU-GAT分年度收益
- 在收益波动较大的年份(2017、2018、2021、2024)表现突出,尤其2024年初12%的超额多头收益表现强劲。
图6 2024年初净值走势
- BiAGRU-GAT模型回撤明显小于基准模型,说明风险管理能力更优。
图7-10 相关性对比
- BiAGRU-GAT模型增强了与基本面因子(盈利、成长、SUE、EP)的正相关性,并减弱了与市值、中盘因子的相关性,体现从规模效应向基本面驱动转变。
表7 AI增强组合年化超额收益
- BiAGRU-GAT在中证500和中证1000指数的增强组合年化超额收益分别达17.2%和24.1%,领先其他模型。
表8、9 增强组合分年度风险收益分析
- BiAGRU-GAT模型稳定保持较高信息比率和月度胜率,且超额最大回撤显著低于基准,尤以2024年为甚。
图11、12 2024年超额净值表现
- BiAGRU-GAT增强组合在市场回撤期间表现出更强的抗风险能力,净值回撤幅度明显比基准组合小。
---
4. 估值分析
本报告着重于构建与模型性能比较,未涉及传统的企业估值或估值方法论分析,主要为量化因子构建及股票池策略实证验证,并无传统DCF或市盈率估值等模块。
---
5. 风险因素评估
- 市场系统性风险:模型面临宏观经济、政策、市场整体波动的影响,可能导致因子及组合表现大幅波动。
- 资产流动性风险:高换手策略在流动性不足时可能引发执行成本及滑点扩大。
- 政策变动风险:监管及政策调整可能导致相关行业估值变化或数据可获得性变化。
- 因子失效风险:模型所依赖的因子可能出现衰退,使得选股能力下降。
- 缓解策略:报告虽未明确提出对应对策,但通过多模型对比和组合构建风控约束进行一定风险控制。整体风险管理意识明确。[page::1,3,7,8]
---
6. 批判性视角与细微差别
- 模型融合的局限:报告指出简单“特征拼接”法难以融合基本面与量价信息的有效成分,反映了数据结构差异对模型的挑战。
- 二次加权模型交易成本显著提升,换手率大幅增加可能不利于实际应用,需要权衡。
- 图神经网络虽能有效缓解上述问题,但也增加了模型复杂度和计算成本,实际应用门槛较高。
- 不同年份表现差异较大,提示模型回测效果带有阶段性特征,市场环境与模型表现关系密切,投资需持续关注模型适应性。
- 回撤阶段表现虽有改善,但风险仍需警惕,尤其是市场极端波动期间的持久抗风险能力仍需进一步验证。
---
7. 结论性综合
本报告系统地分析了在量化选股中融合“基本面信息”与“量价信息”的问题,基于深度学习与先进图神经网络算法,提出了BiAGRU-GAT模型,在股价预测、选股能力及风险控制方面优于传统及二次加权模型。重点包括:
- 单独的基本面信息和量价信息因子均具备有效的选股能力,但融合困难显著。基础深度学习模型无法有效整合两者信息,简单特征拼接难以提升表现。
- 应用二次加权策略虽使模型更好地吸收基本面因子信息,提升了与盈利、成长、SUE等基本面指标的相关性,但加剧了换手率并且在2022、2023年表现不佳。
- 利用图神经网络(GAT)对基本面构建的股票图结构信息进行动态加权修正,形成的BiAGRU-GAT模型成功实现了两类信息的高效融合。该模型表现出了更佳的周度选股能力,显著提高了因子与基本面的相关度,同时降低与市值规模因素的相关性。
- 在中证500和中证1000增强组合的实证测试中,BiAGRU-GAT组合超额收益提高,尤其是2024年出现明显超额收益和更低回撤,展现了模型在实际投资中较强的应用价值和稳健性。
- 整体来看,图神经网络对基本面信息以图结构形式的编码及动态注意力机制应用,是深度学习量化建模对选股因子融合的较优范式。
- 报告最终强调需关注市场系统性风险、流动性风险、政策风险及模型因子失效风险,提醒投资者在应用此类复杂模型时注重风险管理和动态调整。
图表的深刻见解贯穿全文:无论表格中的因子绩效指标,还是图形所示的多头超额收益趋势,均印证了BiAGRU-GAT模型在量价与基本面融合上的优势及在投资组合层面风险与收益平衡上的进步。
综上,海通证券的这篇研究报告不仅对基本面与量价特征融合的技术路径进行了创新性的探讨,也在实证层面验证了图神经网络在智能选股领域的应用潜能,为量化投资策略的演进提供了重要参考基础。[page::0-8]
---
(附部分关键图表 markdown 格式引用示例)
二次加权模型流程示意图
-

BiAGRU-GAT模型Top10%组合超额净值走势
-

---
总结:本报告充分利用了深度学习技术与图神经网络对股票数据中不同信息维度的融合问题进行创新探索,并通过详实的量化实证验证提供了强有力的支持,体现了海通证券在智能量化策略研发方面的前沿水平。