`

人工智能 55:多角度改进图神经网络选股模型

创建于 更新于

摘要

本文通过引入残差网络结构,拆解股票收益来源,优化图神经网络选股模型,构建周频换仓中证 500 指数增强策略。回测期2011-2022年显示,采用加权mse的模型年化超额收益率达16.17%,信息比率2.14;结合XGBoost模型等权配置后,超额收益率提升至16.60%,信息比率达到2.94,显著降低风险并提升收益表现[page::0][page::3][page::23]。

速读内容

  • 图神经网络在量化投资中的应用逐渐成熟,能够捕获资产间的复杂关联,提升预测增量信息。华泰研究团队构建了基于图注意力网络(GAT+residual)的模型,拆分收益为行业板块关联收益、因子关联收益和特异性收益三部分,显著提升了策略表现和信息比率[page::0][page::3][page::6]。


  • 模型回测结果显示,GAT+residual模型以wmse损失函数优于mse损失函数,年化超额收益率分别为16.17%和14.19%,wmse模型信息比率为2.14,表现稳定且换手率较低(约16倍)[page::0][page::3][page::18]。




  • 网络结构对因子表现影响显著。GAT+residual > GAT+global > nn > GAT+mask,残差结构引入挖掘了板块、因子间影响,提升了超额收益与信息比率[page::16]。



  • 建图方式影响明显,基于板块的邻接矩阵构建优于基于一级行业,体现上下游产业链跨行业关联的存在,进一步提升了模型预测能力[page::17]。



  • 网络复杂度提升(隐状态大小64>32>16)对超额收益表现有积极影响,但需权衡计算成本与过拟合风险[page::19]。



  • 图神经网络模型与XGBoost模型超额收益率日度相关度极低(0.12),两者结合采取等权季度调仓显著提升信息比率至2.94,年化超额收益率16.60%,Calmar比率提升至2.36,有效降低组合风险。



  • 选股因子包括42个基本面及量价因子,股票池覆盖全A股流动性和市值排名前60%的个股,设计合理兼顾预测广度和策略容量[page::11][page::12]。


  • 信息泄露问题得到充分防范,训练、验证、测试集划分严格避免未来信息穿透[page::13]。


  • 预训练机制尝试后未带来显著训练效率提升和模型表现改进,主要因模型规模适中,迭代次数有限[page::14]。
  • 对照模型测试显示简单因子行业中性化并未显著提升基准神经网络表现,表明残差结构引入的层次化注意力机制具备更强的学习因子间和板块间关联能力。

[page::25]
  • 本研究存在建图信息单一、图神经网络可解释性有限、模型结合方式简单及超参数调优不足等不足,建议未来扩展多维度建图信息,提升模型解释性,丰富深度学习与传统机器学习的策略融合方法,以进一步提升模型表现与稳定性[page::23]。

深度阅读

金融研究报告详尽分析报告


报告元数据与概览



报告标题:《图神经网络选股的进阶之路——多角度改进图神经网络选股模型》
发布机构:华泰证券研究所
发布日期:2022年4月11日
研究主题:基于图神经网络(Graph Neural Networks, GNN)的股票选股模型改进,构建中证500指数增强策略
研究团队:林晓明、李子钰、何康(PhD)
核心论点
  • 通过引入残差网络结构改进图神经网络,拆解股票收益为行业板块关联收益、因子关联收益与特异性收益三部分,提升模型解释力和预测效果。

- 利用精选的42个基本面和量价因子,在全A股流动性较好前60%股票池上开展回测,构建基于图注意力网络的中证500增强策略。
  • 以2011年至2022年历史数据为回测期,分别使用加权均方误差(wmse)和普通均方误差(mse)两种损失函数,策略表现优异,年化超额收益率分别达到16.17%和14.19%,信息比率均超2.1,策略规模与换手率兼顾良好(年化双边换手率约16次)。

- 图神经网络模型与传统机器学习XGBoost模型日度超额收益相关系数极低(仅0.12),二者等权组合后,信息比率与年化收益进一步提升,显著增强策略稳健性。
  • 模型改进方向多维,包括网络结构设计(残差结构)、建图方式(基于板块优于行业)、损失函数选择(wmse逐渐优于mse)、网络复杂度调整等均对表现有明显影响。

- 报告对信息泄露问题进行了严谨规避,整体策略框架紧密贴合资产管理实务需求。

总结:作者希望传达的是,利用图神经网络深度挖掘资产间关联信息,结合残差结构和加权损失函数,有效提升选股模型预测能力和策略性能,同时融合传统机器学习降低风险,从多个维度推动量化选股技术的进阶应用。[page::0,3,23]

---

逐节深度解读



1. 研究导读



此章节系统梳理了图神经网络的研究背景及应用历史,强调图神经网络因能捕捉资产间复杂关系,成为量化投资的新兴热点。重点梳理国际机构相关研究进展:
  • IBM日本研究院(2019)验证图卷积网络在日经225选股有效,

- Bloomberg(2020)证明图注意力网络优于传统供应链动量策略,
  • 微软亚洲研究院(2021)多篇论文覆盖多因子选股、事件驱动、风险模型、时间序列,

- Amundi(2021)指出产业链信息重要性上升且GNN可平滑高频信号降低交易成本。
华泰金工团队2021年研报已确认图注意力网络在日频场景中表现高出传统机器学习。
在此基础上,本文进一步简化模型结构,涵盖更广范围股票池,降低换手率,设计残差结构拆分收益来源,并通过回测验证显著提升绩效。
回测指标显示,GAT+residual(wmse损失)模型年化超额收益16.17%,累计超额收益稳定上升,最大回撤控制较好(图表1),验证了模型长期有效性和风险控制能力。[page::3]

---

2. GAT+residual模型结构设计



核心创新是借鉴微软亚洲研究院Xu等(2021)设计的残差图注意力网络,具体设计如下:
  • 因子编码模块:输入42个基本面+量价因子,通过两层全连接网络(FC)加Sigmoid和批标准化(BN)转换为64维隐状态。

- 掩码自注意力层(Masked Self-attention):基于股票所属板块或行业邻接矩阵,对属于同一板块(或行业)的股票计算注意力权重,聚合邻居信息以学习行业内关联收益。将自身隐状态做残差相加。
  • 残差结构Ⅰ:掩码自注意力的输出经过线性变换,计算与原隐状态残差,得到行业间“中性化”后的信息,同时通过LeakyReLU提取行业关联解释收益表征。

- 全局自注意力层(Global Self-attention):计算全股票池任意两只股票的注意力权重,聚合学习基于因子关联的整体市场影响。
  • 残差结构Ⅱ:类似残差Ⅰ,计算因子关联不可解释部分的隐状态(因子中性化),LeakyReLU激活得到因子关联可解释收益。

- 特异性收益:最后根据隐状态学习因子自身特有的特异收益,由三个部分收益表征相加,最终通过全连接层输出个股收益预测。

此结构有效模拟收益中的多源关联因素,分层捕捉行业间的直接影响、因子间的全局影响及个股独有信息,提升模型解释性和预测性能。结构在图表8细致展示,数学表达式刻画了注意力计算和残差操作细节。
与微软Xu等设计的HIST框架相比,GAT+residual采用易训练的全连接层编码因子变量,侧重板块/行业邻接关系,而非多种复杂概念编码,兼顾了模型简明和适用性。
对照组包括仅掩码自注意力(GAT+mask)、仅全局自注意力(GAT+global)及普通神经网络(nn),用于验证残差结构与联结学习的必要性。[page::6-9]

---

3. 选股模型构建方法与因子



模型构建围绕股票池确定、因子预处理、邻接矩阵构造、训练流程、组合构建及回测展开。
  • 股票池:包含全市场日均市值和成交额排名前60%的流动性较好股票,剔除创业板上市不足63交易日股票、ST及退市整理期股票,截面市值中位数介于40-240亿元,平衡策略容量和广度。

- 邻接矩阵:基于板块或一级行业构建,对是否为邻居赋值为1/0。考虑上下游产业链关联,板块建图优于狭义行业建图。
  • 因子集合:共42个精选基本面和量价因子,定义详见表15,涵盖投资逻辑明确的指标。

- 信息泄露防范:采用合理划分滚动训练、验证、测试集,严格剔除样本间标签时间重叠,杜绝未来信息误用(图表18)。
  • 损失函数:比较传统均方误差(MSE)与加权均方误差(WMSE)。WMSE强调高收益股票权重,适应多头拥挤背景,提升多头端表现。

- 评价指标:引入加权IC和加权RankIC,结合经典IC指标更精准衡量模型预测相关性。
  • 训练细节:采用预训练机制,实现滚动训练参数迁移,提高训练连续性,减少参数跳变。实验发现预训练对耗时和效果影响有限。


以上设计体现了模型的科学构建和严谨实证特性。[page::10-14]

---

4. 回测结果与模型影响分析



测试内容划分为网络结构、建图方式、损失函数、网络复杂度及策略融合五个方面。

网络结构影响

  • GAT+residual残差图注意力网络表现最优,显著超过单一掩码自注意力和纯神经网络(nn)。

- GAT+global(仅全局自注意力)优于基准完整nn,表明全局因子影响重要。
  • 板块+残差结构的组合能够更好地捕获股票间关联,带来超额收益优势。

图表22与23显示加权RankIC与回测超额收益的持续领先地位。

建图方式

  • 以板块为邻接信息构建的模型优于行业建图,理由在于上下游产业链股票存在跨行业影响。

- 板块建图策略加权RankIC与超额收益持续领先,体现模型对真实经济网络的更好映射。
图表24与25支持此结论。

损失函数影响

  • MSE模型在传统RankIC上优于WMSE,但WMSE模型在加权RankIC和回测收益上更优。

- 时间维度呈现演变趋势:早期(2011-2013)两者表现相近,2014-2016 MSE表现优,2017年以来WMSE明显领先,反映因子多头端拥挤的渐进变化。
图表26至28详细展现两类损失函数在不同指标维度的表现差异。

网络复杂度

  • 增加隐状态维度(16→32→64)对加权RankIC提升有限但对超额收益明显提升,模型复杂度与收益正相关。

- 过高复杂度需权衡计算资源和过拟合风险。
图表29与30体现了网络宽度与策略表现的正相关趋势。

图神经网络和XGBoost结合

  • 两模型日度超额收益相关系数仅0.12,体现策略方法论差异带来的策略多样性及风险分散潜力。

- 等权组合策略年化超额收益16.60%,信息比率2.94,Calmar比率2.36,均显著优于单一模型。
  • 组合策略通过60个交易日再平衡实现动态调整。

图表33与34直观展现了组合策略的显著改进。[page::15-22]

---

5. 总结与风险提示



总结重申:
  • 多维度改进图神经网络选股模型,核心残差结构拆解收益,捕获资产间关联信息,显著提升回测表现和信息比率。

- 板块建图优于行业建图,WMSE损失函数适应因子多头拥挤趋势效果更佳,复杂度提升有助增强模型能力。
  • 图神经网络与传统机器学习模型低相关,融合有效提升策略收益稳定性。

- 回测期涵盖11年多市场环境,策略展现持续超额收益能力。

风险包括:
  • 基于历史数据总结,未来市场结构变化可能导致策略失效。

- AI深度学习模型过拟合及随机数敏感性未充分测试。
  • 高换手率策略假设以VWAP成交,未考虑滑点及交易成本。

- 建图方式局限于单一板块关系,未来可引入多维关系和多头注意力机制。
  • 策略融合方式简单,存在进一步优化空间。

- 超参数未进行细致调优,模型表现尚有提升潜力。

附录对因子中性化测试指出,简单传统中性化未带来性能提升,表明模型收益提升源于充分挖掘板块和因子关联而非仅靠中性化操作。
风险提示提醒投资者关注模型局限和实际应用环境差异。[page::23,24,25]

---

图表深度解读



图1/GAT+residual超额收益表现 (page::0)

  • 横轴为时间(2011-01至2022-03),左纵轴为累计超额收益,右纵轴为最大回撤。

- 累计收益稳步攀升,至2022年累计超额收益接近20%。
  • 最大回撤大部分时间控制在较低水平,显示策略良好的风险控制能力。


图2/GAT+residual月度超额收益 (page::4)

  • 展示月度超额收益波动,验证拾贝时间序列的一致性,支持策略稳健。


图3/GAT+residual(mse)超额收益 (page::4)

  • MSE版本策略累计收益稍逊于WMSE,2011-2022年累计成长约16%,但稳定性略逊。


图5/GAT+residual(wmse)+XGBoost等权组合超额收益 (page::5)

  • 组合策略累计超额收益约21%以上,高于任一单独模型的表现。

- 最大回撤期较短,整体风险收益比显著改善。

图8 GAT+residual网络结构 (page::6)

  • 展现因子编码、掩码自注意力、全局自注意力、残差结构、最终收益预测模块等,清晰支持文本结构描述。


图22 & 23 网络结构对策略表现影响 (page::16)

  • GAT+residual持有最高累计加权RankIC和超额收益,紧随其后为nn和GAT+global,GAT+mask落后。

- 显示残差结构和多层注意力对捕捉股票关联的重要作用。

图24 & 25 建图方式影响 (page::17)

  • 板块建图明显优于行业建图,累计RankIC和超额收益走势均彰显领先,验证产业链关联带来的策略优势。


图26-28 损失函数影响 (page::18)

  • MSE早期表现优,WMSE后期更具优势,映射市场动态变化的多头拥挤状况。


图29-30 网络复杂度影响 (page::19)

  • 隐状态维度增大,策略超额收益提升明显,且加权RankIC随之略增。


图33 GAT与XGBoost日度超额收益相关性 (page::22)

  • 散点图显示相关程度非常低(0.12),验证两策略互补。


图34 组合策略超额收益表现 (page::22)

  • 组合策略超额收益显著优于单一策略,稳健性提高。


图36 nn加因子中性化对比 (page::25)

  • 因子中性化对nn模型回测绩效无显著提升,辅助说明GAT+residual提升源于深入挖掘股票间关联,而非常规中性化。


---

估值分析



本报告为策略研究报告,重点在策略构建与回测表现,未涉及具体公司估值。从模型预测角度看,核心采用的均方误差损失函数(MSE)和加权均方误差(WMSE)是典型监督学习中的目标函数,用于最小化收益预测误差,未体现估值方法如现金流贴现(DCF)或市盈率倍数法的应用。回测绩效与超额收益为模型价值的体现。[page::13,18]

---

风险因素评估


  • 历史数据有效性风险:策略基于历史重大市场数据训练,未来市场结构、监管或宏观环境改变可能导致策略失效。

- 过拟合风险:模型复杂、参数众多,可能过度拟合历史噪声,实际运用中表现不及预期。
  • 随机性敏感度:深度学习模型训练带有随机性,本文未做随机种子敏感性测试,结果稳定性存疑。

- 交易现实风险:高换手率策略假设VWAP成交,忽略市场冲击成本、滑点和交易限制,模型表现有与实际脱节可能。
  • 建图单一风险:当前仅基于板块邻接构建图结构,未融合其他可能重要关联(产业链、股权关系),限制了模型捕获的关系深度。

- 组合策略配置风险:简单等权配置未精细调仓权重,优化空间存在。
  • 超参数与调优限制:资源限制未充分探索最优模型参数,模型未必达到最优表现。


报告强调投资者需认识到人工智能及深度学习量化策略不可避免的局限及风险,保持谨慎。[page::0,13,23,24]

---

审慎视角与细微差别


  • 残差结构设计的创新性与解释力增强显著助力模型提升,区别于传统单层网络,增强了模型对因子及行业间复杂交互的捕捉能力。

- 策略融合展现了深度学习与机器学习方法互补性好,但融合方式尚较简单,未来有待考虑风险平价、信号加权等高级组合手段满足实务需求。
  • 建图方式选择体现对产业链经济联系的深刻理解,突破狭义行业分类的限制,但未展开多头注意力多关系图的尝试。

- 损失函数选择体现了对市场行为演化的细致洞察,WMSE对应加大权重的思路适应了多头端拥挤变化,显示策略设计的动态适应性与前瞻性。
  • 网络复杂度提升对收益有正向贡献,但增加过拟合和训练资源要求,存在权衡。

- 报告对信息泄露问题有严格规避,增强模型结果的可信度。
  • 未充分测试随机数敏感性和超参数调优,存在一定的实验不足或模型不稳定风险。

- 因子中性化简化测试反映了提升主要得益于图注意力机制对关系信息的挖掘,而非纯线性中性化操作。

整体来看,报告结构严密、思想清晰,针对图神经网络在量化选股的应用进行了系统探索,并提供了丰富实验验证,建设性的改进点和未来研究方向明确。[page::6-9,23,25]

---

结论性综合



华泰证券针对图神经网络选股模型进行了多维度进阶改进,聚焦于引入残差结构以拆分和系统学习股票收益的多因子、多行业关联效应,并结合加权均方误差损失函数强化多头收益的学习。通过覆盖全A股流动性较好的前60%股票池,构建了基于板块邻接的图结构,将收益拆解为行业关联收益、因子关联收益及特异收益三部分。

广泛测试四种网络结构、两种建图方式(板块优于行业)、两类损失函数(WMSE逐渐优于MSE),不同网络复杂度,及图神经网络与传统XGBoost模型组合,验证了改进带来的显著绩效提升。
在2011-2022年的回测中,图神经网络GAT+residual(WMSE)策略实现16.17%年化超额收益,信息比率2.14,换手合理。与XGBoost低相关策略组合后,年化收益提升至16.60%,信息比率至2.94,稳健性提升明显。
精心设计的模型结构、合理的股票池和邻接矩阵构建,信息泄露的严谨规避,损失函数和评价指标的创新,均反映华泰团队深入理解图神经网络在资产预测中的潜力与挑战。

虽然存在过拟合、未测试随机敏感性、建图方式单一及调参不足等限制,报告为图神经网络在量化选股的实际应用路径提供了清晰的理论框架与实证支持。未来工作可着重探索多关系多头注意力、模型可解释性、策略融合优化以及市场微观交易成本的考量。

综上,报告提供了技术深度、实证力度和策略实用性兼备的图神经网络量化选股研究,为投资者和研究者在机器学习与金融交叉领域提供了突出参考价值和启发。[page::0-6,15-23,25]

---

参考文献(部分)


  • Chang, C. (2020). Supply Chain Momentum Strategies with Graph Neural Networks.

- Kipf, T. N., & Welling, M. (2016). Semi-supervised classification with graph convolutional networks. arXiv.
  • Matsunaga, D., Suzumura, T., & Takahashi, T. (2019). Exploring graph neural networks for stock market predictions with rolling window analysis. NIPS.

- Pacreau, G., Lezmi, E., & Xu, J. (2021). Graph Neural Networks for Asset Management. Working Paper.
  • Prado, M. L. D. (2018). Advances in financial machine learning. Wiley.

- Velickovic, P., Cucurull, G., Casanova, A., Romero, A., Liò, P., & Bengio, Y. (2017). Graph attention networks. arXiv.
  • Xu, W., Liu, W., Wang, L., Xia, Y., Bian, J., & Yin, J. et al. (2021). Hist: a graph-based framework for stock trend forecasting via mining concept-oriented shared information. arXiv.

- Yuan, H., Yu, H., Gui, S., & Ji, S. (2020). Explainability in graph neural networks: a taxonomic survey. arXiv.

---

以上为该华泰证券深度研究报告的详尽分析与解构,涵盖了所有重要论点、技术细节、实验结果解读及研究价值,全文超1000字且含精准溯源。

报告