`

图神经网络选股的进阶之路

创建于 更新于

摘要

本报告基于图神经网络(GAT+residual)创新设计,构建周频调仓的中证500指数增强选股策略。通过残差结构将预测收益拆解为行业板块关联、因子关联和特异性收益三部分,提升模型表达能力。回测显示,2011年至2022年间,策略年化超额收益率达16.17%,信息比率为2.14。板块建图优于行业建图,wmse损失函数优于mse,且提升网络复杂度有益表现改善。此外,图神经网络与XGBoost模型相关性极低,二者结合进一步提升年化超额收益至16.60%,信息比率增至2.94。该研究为深度学习在量化选股领域提供了有效方法论和实证依据。[page::0][page::3][page::23]

速读内容

  • 核心模型为引入残差结构的图注意力网络(GAT+residual),其将股票收益分为行业板块关联解释收益(掩码自注意力)、因子关联解释收益(全局自注意力)及特异性收益,三者相加形成最终收益预测,显示残差结构显著提升预测能力。

[page::6][page::7]
  • 选股模型采用全A股中市值和成交额排名前60%的个股,选取42个投资逻辑明确的基本面与量价因子;基于板块或一级行业构建邻接矩阵,其中板块建图更能捕捉产业链上下游股票影响,优于行业建图。


图表17显示一级行业至板块映射 [page::12]
  • 在模型训练中严格防止信息泄露,删除训练和验证集末端数据以避免未来信息影响;采用均方误差(MSE)和基于收益排序加权的加权均方误差(WMSE)两种损失函数,WMSE可提升多头端表现。

[page::13]
  • 模型性能对比显示:1)GAT+residual模型的加权RankIC表现优于其他对照模型(GAT+mask、GAT+global、普通神经网络);2)板块建图优于行业建图;3)WMSE损失在近年表现优于MSE,尤其多头端拥挤时期;4)网络复杂度提升(隐层维度64>32>16)带来一定性能提升。









[page::16][page::17][page::18][page::19]
  • 结合传统机器学习,图神经网络模型和XGBoost模型日度超额收益相关性仅为0.12,采用等权组合并每60交易日进行再平衡后,提升年化超额收益率至16.60%,信息比率至2.94,Calmar比率显著改善。


[page::22]
  • 附录展示图神经网络中的残差结构实质为非线性板块和因子中性化,实验显示简单线性中性化难以带来性能提升,强调残差结构在挖掘股票间关联关系中的关键作用。

[page::25]
  • 研究风险提示包括:人工智能可能存在过拟合风险,市场规律未来可能失效,模型随机数敏感性未测试,且高换手率对交易成本和实施存在挑战。[page::0][page::24]


深度阅读

金融研究报告详尽分析:“图神经网络选股的进阶之路”——华泰研究,2022年4月



---

一、元数据与报告概览


  • 报告标题:图神经网络选股的进阶之路

- 发布机构:华泰研究,华泰证券股份有限公司
  • 发布日期:2022年4月11日

- 研究主题:以图神经网络(GNN)为核心,改进与优化选股策略,构建中证500指数增强的资产管理模型,探讨深度学习与传统机器学习(XGBoost)结合的投资表现。
  • 核心作者:林晓明、李子钰、何康博士

- 核心论点
- 通过引入残差网络结构,利用图注意力网络(GAT)拆解股票收益为三部分:行业板块关联收益、因子关联收益及特异性收益,提升预测准确度。
- 使用加权均方误差(wmse)和均方误差(mse)作为损失函数分别训练模型。
- 回测结果显示,基于GAT残差结构的模型年化超额收益率最高可达16.17%,信息比率达2.14。
- 图神经网络模型与XGBoost模型超额收益相关系数极低(仅0.12),两者结合进一步提升策略表现。
  • 策略评级与结论:指出图神经网络技术在选股领域的有效性,比传统模型有明显进步,且两种模型结合有利于风险分散和收益提升,适合资管机构应用。


---

二、逐节深度解读



1. 研究导读与背景(页3)


  • 内容概述:介绍图神经网络在量化投资领域的应用历程,回顾IBM、日本、Bloomberg、微软、Amundi等机构的研究成果,显示了图神经网络在选股、风险评估等多个领域的潜力。

- 改进点
- 精选42个基本面和量价因子。
- 使用较简洁的神经网络结构(全连接层+图注意力层)实现因子编码。
- 降低调仓频率至周频,年化双边换手率16倍,平衡收益和交易成本。
- 利用残差网络拆解收益来源,分别学习行业板块和因子间的关系。
- 结合XGBoost模型,以期降低风险、提升组合表现。

2. 残差结构与GAT+residual模型(页6-7)


  • 章节论点

- 借鉴微软亚洲研究院Xu等2021年设计的HIST网络,构建残差图注意力网络(GAT+residual)。
- 该结构将股票收益拆解为三部分:
1. 板块或行业关联收益(掩码自注意力层,Masked Self-attention)
2. 因子关联收益(全局自注意力层,Global Self-attention)
3. 特异性收益(因子特有信息)
- 这种拆解允许模型分别捕获不同层面的关系与特征,理论上提升表达能力。
  • 网络结构详细说明

- 输入是42维因子数据,经过两层全连接层+Sigmoid激活+批标准化,形成64维隐状态。
- 掩码自注意力层构建基于股票板块或行业的邻接矩阵,并计算邻居间注意力权重,只在同板块/行业内传播信息。
- 残差结构Ⅰ将掩码层的隐状态与原隐状态计算残差,代表无法被板块关系解释的信号。
- 全局自注意力层对所有股票计算注意力权重,不受行业限制,用于学习股票间的因子关联互动。
- 残差结构Ⅱ对全局层输出执行残差计算,表示无法被因子关联解释的个别股票特异收益。
- 最终三部分收益相加,经过全连接层输出收益预测。
  • 与HIST网络比较

- HIST输入为历史价格时间序列,使用GRU进行编码;本研究用简洁因子编码,更易训练。
- HIST使用多种股票概念进行图构建,而本研究只用板块或行业做掩码图,对于中国A股市场较为适用。
- HIST通过概念编码计算股票-概念距离加权更新隐状态,GAT+residual直接聚合同板块股票信息。

3. 对照模型设计(页8-9)


  • 设立三组对照:

- GAT+mask:去除全局自注意力,只保留掩码自注意力,聚焦于行业内部影响。
- GAT+global:去除掩码自注意力,只有全局自注意力。
- nn:没有图结构,只用三层全连接神经网络。
  • 用于验证哪个模块对性能贡献最大。


4. 股票池构建(页12)


  • 以流动性和市值筛选股池,剔除退市、ST、上市不足63交易日的股票。

- 按季度筛选过去1年成交额和市值均排名前60%的个股。
  • 股票池规模和中位市值随时间变化,市值中位数保持在40~240亿元。

- 该设计综合考虑了预测样本的有效性和模型训练的计算成本。

5. 邻接矩阵与建图方式(页12、17)


  • 简单基于板块或一级行业构建邻接矩阵(N x N),相同板块/行业的股票连接权为1,其他为0。

- 比较结果显示,基于粗糙板块建图优于精细行业建图,因为产业链上下游股票虽不同行业但有关联。
  • 图24、图25显示板块建图在加权RankIC和超额收益均有更好表现。


6. 防止信息泄露(页13)


  • 只将训练、验证、测试集合理切分,避免训练标签引用未来收益导致的未来函数问题。

- 实际做法是将训练集和验证集末尾的样本剔除一定交易日数(模型预测期长为11个交易日)。
  • 图18提示投资模型的信息泄露风险及防范重要性。


7. 损失函数与评价指标(页13)


  • 采用普通MSE和加权MSE(wmse)作为目标函数。

- wmse对收益排名靠前的股票赋更大权重,提升多头收益预测能力。
  • 除常规信息系数(IC)与排名IC外,还设计了相应的加权版本以更好衡量模型效果。


8. 预训练机制(页14)


  • 在滚动训练中,使用上期训练参数作为本期初始参数,理论上加快训练,平滑模型波动。

- 实证发现预训练对训练效率提升有限,模型训练时间较短,且对表现影响也有限。

9. 测试结果——影响因素综合解析(页15-19)


  • 网络结构

- 加权RankIC排序为nn > GAT+residual > GAT+mask > GAT+global。
- 超额收益排序为GAT+residual > GAT+global > nn > GAT+mask。
- 说明残差结构显著提升模型,且全局图注意力优于仅行业掩码,完整模型最好。
  • 建图方式

- 板块建图优于行业建图,验证理论假设。
  • 损失函数

- mse在早期表现稍优,wmse在2017年后因多头端拥挤更适用,长期来看wmse表现更好。
  • 网络复杂度

- 隐状态维度64优于32和16,复杂度提升带来一定收益,但需注意计算成本和过拟合风险。

10. 图神经网络与XGBoost结合(页20-22)


  • XGBoost模型架构与因子选择基本相同,但方法论不同(传统机器学习vs深度学习)。

- 两模型日度超额收益相关度仅为0.12,显示低相关性。
  • 单独策略表现:XGBoost在2011-2016年相对优,GAT+residual自2017年起表现更好。

- 组合策略等权季度再平衡,超额收益率提升至16.6%,信息比率达2.94,Calmar比率达2.36,风险调整后性能明显提升。

11. 附录中的因子中性化测试(页25)


  • 将行业中性化应用于nn模型未见显著提升,表明GAT+residual效果不是简单中性化的结果,而是有效捕捉了板块和行业间复杂互动信息。


---

三、图表深度解读


  • 图1(页3)GAT+residual(wmse)模型累计超额收益及最大回撤

- 累计超额收益持续增长,尤其自2016年后加速增长,最大回撤发生在2015年行情波动期间,整体回撤幅度可控。
- 体现模型稳健且收益卓越。
  • 图3(页4)GAT+residual(mse)模型累计超额收益

- 与wmse模型相比,累计收益略低,回撤情况较相似,证实wmse损失函数对后期表现提升明显。
  • 图5(页5)GAT+residual和XGBoost等权组合模型累计超额收益

- 组合策略累计回报明显高于两单一模型,且回撤幅度未显著增加,显示策略融合有效降低风险,提升收益。
  • 图8(页6)GAT+residual模型结构图

- 清晰展示三大结构模块和其数据流向,帮助理解残差图注意力层如何分离和逐层学习不同关联层面。
  • 图22与图23(页16)网络结构比较

- 加权RankIC趋势图显示nn单因子_rankic略优,但超额收益图显示GAT+residual实际投资回报最佳,超额收益最终取决于多方面因素。
  • 图24与图25(页17)建图方式对比

- 板块建图对应模型性能(RankIC和超额收益)持续优于行业建图,符合产业链关联理论。
  • 图26-28(页18)损失函数的影响

- RankIC累计成长图揭示初期mse模型表现好过wmse,近年wmse领先,映射多头拥挤市场的适应性。
  • 图29-30(页19)网络复杂度影响

- 隐状态维度越高,超额收益更好,表现网络表达能力增强,但间隔并不明显。
  • 图33(页22)GAT与XGBoost日度超额收益散点图

- 散点分布广泛,相关系数仅0.12,体现两模型策略在组合中有效分散风险的基础。
  • 图34(页22)组合策略累计超额收益

- 组合策略明显跑赢单一策略,为提升收益稳健性提供实证支持。

---

四、估值分析


  • 报告重点在模型构建与回测表现,未涵盖传统意义上的公司估值模型(如DCF、P/E等)。

- 估值方面体现为投资组合策略的风险收益表现分析与提升,并通过绩效指标(年化超额收益率、信息比率、Calmar比率)对模型优劣进行“估值”式的评判。

---

五、风险因素评估


  • 历史规律失效风险:人工智能基于历史数据挖掘规律,未来市场机制变化可能使模型失效。

- 过拟合风险:深度学习模型尤其图神经网络容易过度拟合样本历史数据。
  • 随机性影响:模型对随机种子敏感,未系统测试其稳定性。

- 高频调仓风险:模型采用较高调仓频率(周频),假设以VWAP价格成交,未考虑滑点、市场冲击等实际执行成本,可能高估净收益。
  • 建图单一且简单:目前图构建仅基于板块或行业,忽视更复杂的股权、产业链等关联,限制模型信息全面性。

- 组合配置简化:图神经网络和XGBoost组合方法较简单,仅等权配置,缺乏风险平价或信号加权等更优组合策略。
  • 超参数调优不足:算力受限,未进行系统超参数调优,模型表现可能尚未达到最好。

- 风险提示突出客观且偏重未来市场不确定性。

---

六、批判性视角与细微差别


  • 残差结构非简单中性化:附录实验表明简单行业中性化并未改善全连接网络表现,暗示图神经网络残差结构真实挖掘出更深层次的股票间关联,体现模型的创新点。

- 因果与相关性注意:虽然图神经网络捕获了多尺度关系,当前方法对因果推断仍有限,需要注意模型内部推断结果的解释边界。
  • 数据及模型更新滞后:因训练和验证分割严格,且因子选择固定,模型在快速变动市场表现需进一步验证。

- 组合风险控制改进空间:等权组合简单易懂,但缺乏有效的风险配置与动态调整,未来结合更复杂的多策略融合方法可能进一步提升。
  • 交易成本估算简单:假设VWAP成交忽略市场冲击可能导致回测结果高估净收益,实盘应用需考虑更细致的执行模型。

- 模型对极端行情适应性:回撤图显示2015年市场剧烈波动时代策略损失明显,应进一步验证其在金融危机和市场异常波动时期的稳健性。

---

七、结论性综合



华泰证券团队的《图神经网络选股的进阶之路》报告,系统性地展示了将图神经网络技术及其残差结构应用于A股选股策略的全貌,取得了丰富且有力的实证成果。该研究从模型设计的多角度(网络结构、建图策略、损失函数、网络复杂度)细致考察,确认了引入残差结构以分离行业关联、因子关联和个体特异收益的显著价值。

基于2011年至2022年长期回测,优选模型(GAT+residual,采用wmse损失函数)实现了16.17%的年化超额收益率和2.14的信息比率,表现稳定且有较强风险控制能力。此外,采用板块而非一级行业作为图结构邻接矩阵更符合A股产业链复杂形态,带来收益提升。

深度学习与传统机器学习模型(XGBoost)表现互补,日度收益相关度仅0.12,组合配置明显提升信息比率至2.94,表明多模型融合策略在实际资产管理中具有重要潜力。

报告深刻揭示了图神经网络在挖掘股票间深层关系上优于传统模型的优势,通过创新的残差结构层层剥离不同关联,提升了收益预测质量,也为后续金融机器学习提供了新思路。

不过,该研究尚然有待进一步完善,如加入更复杂的关系图、多头尾部更精细的权重设计、随机敏感性测试、多策略动态配置探索,以及对实际交易成本、极端行情的更深入考察。

总的来说,华泰证券团队的研究报告准确清晰地反映了图神经网络及残差结构的强大潜力,展示了量化投资领域深度学习技术应用的前沿成果,并以翔实数据与可视图表充分支持其结论,对行业具有重要参考价值。

---

(本报告引用页标记示范:核心对GAT+residual模型的绩效展示见页3-5 [page::3,4,5];网络结构详解见页6-8 [page::6,7,8];建图及防止信息泄露见页12-13;损失函数、组合策略相关分析见页18-22;总结见页23。)

报告