`

多角度改进图神经网络选股模型

创建于 更新于

摘要

报告提出基于残差结构的图神经网络(GAT+residual)改进选股模型,通过拆解收益因子,结合42个基本面和量价因子构建中证500指数增强策略,回测期2011年至2022年,年化超额收益率达16.17%,信息比率2.14。引入加权均方误差损失函数提升多头端表现,并发现板块建图优于行业建图。通过将图神经网络与传统机器学习模型XGBoost等权组合,相关度仅0.12,组合策略年化超额收益提升至16.60%,信息比率达2.94,显著降低风险并提升绩效[page::0][page::3][page::15][page::23]。

速读内容


残差图注意力网络结构改进选股模型 [page::0][page::6]

  • 利用残差结构拆解股票预测收益为三部分:基于板块关联解释的收益、因子关联解释收益和特异性收益。

- 采用掩码自注意力学习板块内股票影响,全局自注意力学习股票间因子关联信息,提升模型表达能力。
  • 模型输入42个明确的基本面及量价因子,并通过两层全连接网络编码,隐状态维度64。


股票池与建图方法设计 [page::12]

  • 股票池涵盖全A股总市值和成交额排名前60%,剔除非流动股及ST等风险股。

- 侧重基于较粗糙板块(非单一行业)构建邻接矩阵,捕捉产业链上下游股票间相互影响,提高模型有效性。
  • 板块建图优于一级行业建图,体现跨行业关联的重要性。




损失函数和网络复杂度影响 [page::18][page::19]

  • 加权均方误差损失函数(wmse)在收益较高股票赋予更大权重,提升多头端效果,2017年后逐步优于普通mse。


  • 提升网络隐状态维度(64 > 32 > 16)带来超额收益提升,但需平衡计算资源和过拟合风险。




GAT+residual模型与对照组及XGBoost组合效果 [page::16][page::20][page::22]

  • GAT+residual网络结构优于传统GAT+mask、GAT+global和普通神经网络对照模型,残差结构显著提升信息挖掘能力。


  • XGBoost与GAT+residual模型因策略相关度极低(0.12),两者等权组合显著提升年化超额收益至16.60%,信息比率达2.94,风险调节效率大幅提升。




关键回测绩效与策略表现概览 [page::4][page::5][page::15]


| 模型 | 年化收益率 | 夏普比 | 信息比 | 年化超额收益率 | 超额收益Calmar比率 | 换手率(双边) |
|-------|------------|--------|--------|----------------|-------------------|--------------|
| GAT+residual(wmse) | 18.47% | 0.67 | 2.14 | 16.17% | 1.84 | 16.06 |
| GAT+residual(mse) | 16.57% | 0.62 | 2.43 | 14.19% | 1.62 | 16.42 |
| XGBoost | 19.10% | 0.71 | 2.19 | 16.58% | 1.26 | 16.07 |
| 组合等权(GAT+XGBoost) | 19.01% | 0.71 | 2.94 | 16.60% | 2.36 | 16.17 |
  • GAT+residual结合XGBoost策略有效降低策略相关性、优化风险收益比,适合机构指数增强投资应用。

- 调仓频率周频,理论假定vwap成交,忽略高频交易成本及冲击。

量化因子汇总及策略池 [page::11]

  • 选取42个基本面和量价因子,包括估值(如1/市净率)、预期增长(EPS、ROE增长率)、反转(5日、1月收益率)、波动率、换手率及日间技术因子。

- 因子数据经过5倍MAD缩尾、ZScore标准化处理,缺失值填0或剔除。
  • 股票池为全A股日均总市值和成交额排名前60%个股,兼顾流动性与容量。


风险提示与未来研究方向 [page::23]

  • 模型存在过拟合风险,训练未进行随机数敏感性检测,且高换手率假设基于vwap成交价格。

- 未来考虑多维图结构构建(股权结构、产业链)、多头注意力机制,提高模型解释能力。
  • 结合策略权重优化方法(如风险平价、信号加权)提升组合表现。

深度阅读

图神经网络选股的进阶之路 — 华泰研究报告详尽解析



---

一、元数据与概览 (引言与报告概览)


  • 报告标题:《图神经网络选股的进阶之路》

- 作者及联系方式:林晓明、李子钰、何康(PhD),均隶属华泰证券,联系方式详见报告末页
  • 发布机构:华泰证券股份有限公司

- 发布时间:2022年4月11日
  • 研究主题:运用图神经网络(GNN)技术对中国A股市场构建中证500指数增强选股策略,重点改进选股模型架构,结合深度学习与传统机器学习方法提升投资组合表现


核心论点与结论

本报告对图神经网络在量化选股中的应用进行深化,创新性地引入残差结构(GAT+residual),将股票预测收益拆解为:股票间行业板块关联解释收益、股票间因子关联解释收益与特异性收益三部分,并分别通过不同网络模块独立建模与学习。回测期限从2011年1月至2022年3月,构建周频换仓的中证500指数增强策略,表现优异:
  • 年化超额收益率:GAT+residual (wmse) 达到16.17%,等权mse为14.19%。

- 信息比率分别为2.14和2.43,Calmar比率为1.84和1.62。
  • 结合传统机器学习算法XGBoost后,因两者日度超额收益相关度仅0.12,组合策略年化超额收益率提升至16.60%,信息比率显著增加至2.94,Calmar比率提升至2.36,风险调整后表现更优。


核心亮点为模型架构创新、因子精选、股票池优化、换手率控制与模型融合策略,均支持了模型的持续稳定性及实用性。[page::0,3,23]

---

二、逐节深度解读



2.1 研究导读与背景



图神经网络(GNN)在近年深度学习领域兴起,逐步应用于量化投资领域,突破传统策略将资产视为相互独立个体的假设,改为学习股票间复杂关系,进而获得额外预测信息。[page::3]

报告回顾了行业内先驱机构的研究进展:IBM日本研究院(2019)、Bloomberg(2020)、微软亚洲研究院及Amundi(2021)等,均验证了GNN在选股及资产管理中的潜力和价值,奠定了本报告研究基础。[page::3]

团队此前研究(2021年2月《图神经网络选股与Qlib实践》)证实图注意力网络在日频选股场景表现优于传统机器学习,为此次工作提供延伸。此次研究在策略容量、换手率和模型简洁性提升方面实现突破。[page::3]

2.2 GAT+residual网络结构



借鉴微软亚洲研究院Xu等(2021)提出的HIST模型,报告设计了特点鲜明的残差图注意力网络结构,将预测股票收益分拆为三部分:
  1. 行业或板块关联解释的收益:通过“掩码自注意力”(Masked Self-attention)模块,利用行业板块邻接矩阵筛选邻居股票,计算行业内各股票间影响权重。

2. 因子关联解释收益:上层残差输入“全局自注意力”(Global Self-attention)模块,遍历股票池任意两股票间关系,捕捉因子维度关系。
  1. 特异性收益:残差中的不可解释部分,代表个股独有收益特征。


三部分收益最终相加,经全连接层输出单只股票收益预测。[page::6-7]

网络架构的技术细节:
  • 输入为42个选取明确且具解释力的基本面及量价因子,经过两层全连接网络及Sigmoid激活获得64维隐状态。

- 掩码自注意力对属于同一板块的股票执行注意力机制,权重通过LeakyReLU激活后softmax归一化。
  • 全局自注意力则不受板块限制,计算全股票池间通用注意力。

- 两个残差结构通过计算残差隐状态实现非线性行业、因子中性化,进一步减少组合中无效风险因子影响。

与历史HIST模型主要差异在于:
  • 输入数据类型不同(本报告为截面因子,HIST为序列数据);

- 系统建图采用简单的行业/板块邻接代替复杂概念编码;
  • 掩码自注意力模块简洁高效,适用于中证500类大型股票池。[page::7-8]


2.3 对比对照模型



为量化残差结构及建图策略贡献,设计三种对照模型:
  • GAT+mask:仅保留掩码自注意力,去全局自注意力;

- GAT+global:仅全局自注意力,去掩码自注意力,复刻华泰早期架构;
  • nn:基线全连接神经网络,去除任何图结构模块。


网络结构呈图解及流程清晰,便于后续比较。[page::8-9]

2.4 股票池及因子设计



股票池涵盖全A股中流动性强、规模大的前60%股票(以市值和成交额双重排名),在剔除新上市、ST、退市个股后构建,保持策略有效容量与数据质量,量级自2011年以来从约800支增至2100支以上,市值中位数介于40亿至240亿元之间,保证模型训练的可扩展性与策略容量。[page::10-12]

42个核心因子涵盖估值(如市净率、市盈率倒数)、预期(如一致预期EPS增长)、反转、波动率、换手率及日内技术多维度指标,兼顾基本面与市场行为特征,因子高度投资逻辑明确。详细定义具体列出,因子标准化和缺失处理严格,确保输入质量。[page::11]

2.5 构建邻接矩阵与建图方式



针对掩码自注意力模块,采取基于板块或一级行业构建邻接矩阵:
  • 行业建图简单,两股票若同属行业即为邻居;

- 板块建图更宽泛,考虑产业链上下游关系,允许跨行业交互;

板块映射详列五大类板块及所含一级行业,实现行业间相对粗糙但更有效的关联映射。[page::12,17]

2.6 防止信息泄露措施



细致划分训练、验证、测试集,并删除接近数据集尾端与下阶段样本重叠的记录,规避未来信息跑偏风险。示意图清晰展现信息泄露区间,被严格控制。[page::13]

2.7 损失函数与评价指标



测试均方误差(MSE)与加权均方误差(WMSE)两种损失函数:
  • WMSE通过收益率排序加权,提升对高收益样本关注度;

- 评价指标包括IC、RankIC及其加权版本,能够准确评估因子质量;
  • 半衰期设计为N/2,关注收益端的权重递减分布,契合实际选股需求。[page::13]


2.8 预训练方式



滚动训练中采用模型权重迁移以期提高训练效率和平稳连续性,经测试发现预训练对模型表现影响有限,受限于网络规模较小,训练时间消耗不显著。[page::14]

2.9 测试结果概览



测试内容涵盖网络结构、建图方式、损失函数、网络复杂度及图神经网络与XGBoost结合。
  • 网络结构:GAT+residual(残差结构)表现最佳,其次为GAT+global,再到nn和GAT+mask。

- 建图方式:板块建图优于行业建图,支持产业链上下游跨行业影响假设。
  • 损失函数:MSE对早期表现稍优,WMSE优势在近几年因子多头拥挤时更显著。

- 网络复杂度:增加隐状态数 (64 > 32 > 16) 带来收益提升,但应兼顾计算和过拟合风险。
  • 模型融合:GAT+residual与XGBoost组合显著提升收益和风险指标,凸显深度学习与传统机器结合优势。[page::15-19,22]


2.10 图神经网络与XGBoost结合的实证


  • 两者每日超额收益率的相关系数仅0.12,表明其模型捕获的信号具备较强互补性。

- 组合策略以等权、60交易日再平衡方式,有效提升年化超额收益率至16.60%,信息比率攀升至2.94,Calmar比率显著提高,显示风险调整后表现的稳健提升。[page::20-22]

---

三、重要图表深度解读



图表1 & 3(GAT+residual模型超额收益表现)



图形反映出GAT+residual分别使用加权WMSE和MSE损失函数下的累计超额收益与最大回撤,红色线代表累计收益,灰色柱为最大回撤。
  • GAT+residual (wmse)累计超额收益曲线持续平滑上升,最大回撤波动虽存在但未扩散至策略整体,显示良好的顺势能力及控制风险。

- GAT+residual (mse)表现稍弱,累计收益明显不及wmse版本,最大回撤波动较小,显示出较低的收益波动率。
  • 两图均体现了相对中证500基准的超额收益明显和风险可控优势。[page::0,4]


图表22 & 23(网络结构影响)



累计加权RankIC图显示nn模型因其非图结构特性,单因子预测能力在部分时间段优于图神经网络,但结合超额收益的表现却落后,表明单因子预测能力和实盘收益转换并非线性关系。
  • GAT+residual在因子质量及超额收益两方面均表现优异,暗示残差结构有效捕获股票间复杂关系。

- GAT+mask表现最差,GAT+global居中,有效论证了全局视角建模的优势。[page::16]

图表24 & 25(建图方式影响)



对比板块与行业建图,累计加权RankIC和超额收益均显示板块建图更有助于模型捕捉产业链上下游跨行业影响,促使策略更稳健提高表现。

图表26-28(损失函数影响)


  • MSE短期内表现更优,尤其2011~2016年;

- WMSE在接近当前年份后声望增长,随着多因子策略的多头端显著拥挤,WMSE通过加权机制提升多头端表现,进而带来整体收益增长。

图表29 & 30(网络复杂度)



隐状态维度从16递增至64,累计加权RankIC和超额收益均上升,表明适度提高模型复杂度利于收益提升,但报告警示过大网络复杂度有溢出风险。

图表33 & 34(模型结合相关性及收益)


  • 日度超额收益散点图显示GAT+residual和XGBoost相关性极低,具备策略组合潜力。

- 组合累计超额收益明显优于单一模型,强化了深度学习和传统机器学习的互补性。

---

四、估值分析(财务估值未涉,本报告为策略技术研究,无明确估值预测)



因本报告聚焦于模型设计与量化策略表现,未涉及公司财务估值或个股目标价等部分,故无估值分析章节。

---

五、风险因素评估


  • 市场规律时效性风险:所有AI/深度学习方法基于历史信息总结,未来若市场结构发生变化,模型效果可能受限。

- 过拟合风险:深度学习模型复杂,可能过拟合于历史数据,导致泛化能力减弱。
  • 随机数敏感性未测:模型训练受随机初始化影响大,报告未完成随机数敏感性测试,存在表现波动风险。

- 高换手率假定弱化现实交易影响:策略调仓频率较高,交易假设基于vwap成交,忽略了市场冲击和交易成本可能放大风险。
  • 建图单一与解释性不足:仅基于板块建图且采用单头注意力机制,未来考虑扩展至多种关系和多头机制;缺少对注意力机制的深入解释,存在可解释性弱项。[page::0,23,24]


---

六、批判性视角与细微差别分析


  • 模型复杂度与容量权衡:报告虽表明64维隐状态优于32及16,但未展示网络更大规模或层数更深的尝试,缺乏规模扩展下的训练稳定性与过拟合控制细节。

- 信息泄露处理较为简单:报告删除尾端样本控制信息泄露,但未详细阐述验证与测试过程中的时序依赖及潜在未来信息泄露风险,尤其在高频因子变动环境下仍需谨慎。
  • 因子选择与权重未公开透明:因子权重及构造细节有限,部分因子定义模糊,如“kmid”等,影响模型复现性。

- XGBoost模型因子覆盖更广:XGBoost因子包含更多成长、盈利、质量等指标,更侧重基本面预期,导致两模型捕捉信号不同,报告虽说明差异未详细展开两者信号异质性和具体策略差异。
  • 对模型可解释性及业务适配讨论不足:仅简单提及未来可借鉴Explainability技术,但对当前模型黑箱风险、信号验证缺少学术和实务结合的深度讨论。


总体来看,报告秉持谨慎,详细披露了当前模型优势和不足,未陷入单一乐观或忽视潜在问题。[page::23]

---

七、结论性综合



本报告系统地设计、优化和验证了基于图神经网络的选股策略,核心通过创新残差注意力网络结构(GAT+residual),将股票收益拆分为产业链板块关联收益、广义因子关联收益和特异性收益三大组件,分别捕捉不同维度的资产相关性和个股特征,丰富了传统单因子和标准多因子模型。

在2011-2022年的中证500指数样本回测中,采用加权均方误差(wmse)损失对高收益个股加大训练权重,进一步提升策略表现,年化超额收益达16.17%,信息比率2.14,Calmar比率优于传统方法。同时通过股票池优化避免容量和换手率极端,切实控制交易风险。

报告深刻揭示了模型模块组成、建图方式、损失函数及网络复杂度对模型效果的影响,验证了基于板块建图和残差结构是提升策略有效性的重要路径。此外,创新性地将图神经网络与传统机器学习XGBoost结合,实现低相关信号优势叠加,显著提升年化超额收益(16.60%)及风险调整指标,验证了跨方法融合的实用价值。

图表分析直观展示了超额收益曲线及各模型性能对比,揭示残差结构模型在稳定性和收益性上的领先地位。信息泄露控制、训练流程及因子设计细节均体现高度严谨。尽管存在过拟合风险、随机效应未测和模型可解释性不足等限制,报告提出未来改进方向(如多头注意力机制、关联多样性、融合优化及模型解释工具),具有较强的前瞻价值。

总体而言,华泰研究团队通过系统的科研和实证工作,推动了图神经网络在A股量化投资领域的应用进程,为智能选股和组合构建提供了科学且可落地的技术路线,是量化投资研究和实务界值得参考的重要成果。[page::0-25]

---

重要附图Markdown链接


  • GAT+residual(wmse)模型超额收益表现


  • GAT+residual(mse)模型超额收益表现


  • GAT+residual网络结构示意


  • 微软亚研院 HIST 网络结构(对比参考)


  • 网络结构超额收益对比


  • 建图方式超额收益对比


  • 损失函数超额收益对比


  • 网络复杂度超额收益对比


  • GAT+residual与XGBoost模型日度超额收益相关


  • 组合策略超额收益表现



---

总结



该研究报告全面详实地验证了图神经网络,特别是含残差结构的图注意力网络在中国市场中证500指数选股上的优越表现。通过细致的数据处理、模型设计和风险管控,成功提升了超额收益和风险调整收益指标,同时创新性地与传统机器学习模型结合,进一步推动策略的综合性能。

报告对于深度学习模型应用于金融量化,尤其是如何构建有效的图结构信息、避免信息泄露、合理设计损失函数以及融合多模型优势提供了宝贵经验,同时也坦诚了模型当前的风险与不足,为后续研究指明了方向。

作为量化研究与实战应用的典范案例,此报告值得金融机构、资产管理团队及研究者深入学习和借鉴。[page::0-25]

---

(全文上述引用均基于报告原文页码标识)

报告