`

【国盛金工】量化专题:提升AI模型边际效能:图注意力网络与特征集成

创建于 更新于

摘要

本报告通过引入图注意力网络(GAT)和多维度特征集成方法,提升了AI选股模型的边际效能。基于差异化数据集和多模型堆叠策略,结合手工构建的量价与基本面特征,形成深度学习选股因子,有效提升因子多头超额收益至45.4%,5日和10日IC均值分别达到12.9%和14.7%。构建的中证500和中证1000指数增强组合在2019至2023年间表现优异,分别实现年化超额收益18.6%和28.1%,信息比率高达2.98和3.67,验证了该方法在实盘的应用价值。[page::0][page::1][page::4][page::6][page::7][page::9][page::10][page::13]

速读内容

  • 报告提出提升AI选股模型绩效的三大思路:多数据集输入堆叠、单一模型精进、多模型输出堆叠,其中本文重点聚焦第三点,即通过同一数据集不同模型训练输出堆叠提升效能。[page::0]

- 引入图注意力网络GAT结合LSTM时序模型,捕捉股票间的空间关联信息,改善单一数据集在时间维度的预测能力,采用行业和风格双邻接矩阵构建股票图结构,显著增强网络对截面关系的建模能力。[page::3][page::4][page::5]
  • 基础数据集(数据集1-5)与手工特征集(alpha158量价因子和基本面因子)分别训练三类网络(Baseline LSTM、GAT-ind与GAT-ind-style),多模型复杂度的提升带来因子多头超额收益及IC均值的稳步提高。

- 基础数据集多头超额收益范围为23.9%~25.9%;
- alpha158因子多头超额收益在19.1%~21.9%间波动;
- 基本面因子多头年化收益24.5%,IC均值8.1%。


[page::5][page::6][page::7]
  • 采用三大GBDT集成算法(LightGBM、XGBoost、CatBoost)对多模型、多数据集因子特征进行集成,基于多维度标签设计与多预测窗口实现差异化因子融合,通过多次特征随机叠加生成富多样性的综合特征集合。


[page::8]
  • 集成模型绩效显著优于单模型,多模型堆叠与多次集成:

- LSTM单因子集年化多头超额收益36.6%,5日IC均值11.5%,10日IC12.9%;
- 引入GAT模型后提升至37.3%多头超额收益,IC无明显变化;
- 结合手工特征集及多模型多次集成后,综合因子多头超额收益提升至45.4%,5日IC12.9%,10日IC14.7%。

[page::9][page::10][page::13]
  • 基于综合深度学习因子构建周频调仓的中证500和中证1000指数增强组合,两大组合表现优异:

- 中证500指数增强组合年化收益24.0%,超额收益18.6%,跟踪误差5.5%,信息比率2.98,月度胜率78%;
- 中证1000指数增强组合年化收益33.8%,超额收益28.1%,跟踪误差6.4%,信息比率3.67,月度胜率81.4%。


[page::11][page::12]
  • 风险提示:研究结论基于历史数据和模型推演,存在失效风险,投资者需谨慎判断。[page::13]

深度阅读

【国盛金工】量化专题:提升AI模型边际效能:图注意力网络与特征集成——详尽剖析报告



---

一、元数据与报告概览


  • 报告标题:《提升AI模型边际效能:图注意力网络与特征集成》

- 作者:缪铃凯、刘富兵
  • 发布机构:国盛证券研究所金融工程团队

- 发布日期:2024年6月17日
  • 主题:主要围绕基于深度学习的AI选股模型,通过引入图注意力网络(GAT)和多样化的特征集成技术,提升量化选股模型的边际效能,最终构建指数增强投资组合。

- 核心论点
1. 通过差异化网络模型(LSTM、GAT)对同一数据集的多模型训练并堆叠因子输出,提高模型整体绩效。
2. 引入图结构刻画股票间空间关联信息,提升时序预测能力。
3. 集成多样手工特征(量价、基本面),捕获端到端模型无法完全提炼的Alpha。
4. 在特征集成阶段,通过多维度数据输入、多算法集成及多类型标签设计,实现选股能力的显著提升。
  • 主要成果

- 回溯2019-2023年,深度学习comprehensive因子多头超额收益达45.4%。
- 构建的中证500和中证1000指数增强组合的年化超额收益分别达到18.6%和28.1%,信息比率均高于2.9,表现优异。[page::0,1,8,13]

---

二、报告章节详细剖析



1. 报告摘要与分析框架(页0-1)


  • 关键信息

- 报告阐述了3个思路提升AI选股模型绩效,其中重点聚焦第三思路——对同一数据集使用多种模型训练并堆叠因子输出。
- 技术上引入图注意力网络(Graph Attention Network,GAT)以捕捉截面股票之间空间依赖关系,同时保留时序LSTM优势。
- 除原始量价数据外,增加手工构建的量价和基本面因子,明显增厚Alpha信息。
- 通过多维度数据输入、模型算法和标签的集成设计,实现综合提升。
  • 投资组合表现

- 中证500和中证1000指数增强组合在2024年初至5月底实现显著超额收益(10.1%、8.2%),验证方法有效。[page::0,1]
  • 图表解析

- 图表1-2展示今年以来中证500/1000指数增强组合净值表现,组合净值均优于基准及相对强弱指数。
- 图表3阐释整体建模流程:从数据输入到特征工程→集成模型→因子输出→组合优化,清晰描述了模型构建流程。[page::1]

---

2. 数据输入与网络模型设计(页2-4)


  • 数据集说明

- 共7个数据集:前五个为基础量价数据(包括日K线、分钟K线、日内收益分布、资金流、技术指标);第六个为量价手工因子alpha158;第七个为基本面财务因子集。
- 各数据集经过细致预处理,如价格标准化、以30日/40日窗口构建时间序列等。
- 具体预处理保持模型输入稳定且具有时间序列特征。[page::2,3]
  • 神经网络结构

1. 采用LSTM处理股票的时间序列输入,有效捕获长期时序依赖。
2. 引入图注意力网络(GAT)捕捉股票间的截面关系。GAT核心在于用注意力机制自动赋予邻居节点不同权重(基于行业和风格构造邻接矩阵),从结构上把握股票间的复杂关联性。
3. 网络步骤详解:输入数据→LSTM生成隐藏状态→自注意力机制处理内部依赖→GAT处理股票间连通性→MLP生成最终因子输出。
4. 针对不含时间序列的基本面数据,跳过LSTM,直接用GAT处理。
  • 数学模型

- 介绍了GAT的核心数学运算:节点特征变换、注意力权重计算及softmax归一化等,突出图结构建模的精髓。
- 邻接矩阵构建策略:
- 基于行业信息定邻接矩阵,即股与行业同属则连边。
- 基于行业和风格信息构建双邻接矩阵,分别建模两个GAT并行处理,融入风格因子权重并通过top-k筛选最大权值邻居。[page::4,5]

---

3. 因子信号评估(页5-7)


  • 模型对比

- 训练了三类模型:Baseline(纯LSTM)、GAT-ind(LSTM+行业邻接GAT)、GAT-ind-style(LSTM+行业+风格双邻接GAT)。
- 使用回溯期2019-2023年周频数据,按IC(信息系数)和多头超额收益评估。
  • 基础数据集因子相关性与绩效(图表5-6)

- 跨模型和数据集的因子相关性较高,GAT模型普遍拉升了因子之间的相关度。
- 但因子多头超额收益与IC均有所提升(23.9%→25.9%),说明GAT网络改善了单一数据集预测能力。
  • 手工特征数据集评估

- 量价因子alpha158采用谱聚类方法降维处理,聚成8类综合特征供神经网络输入。
- 量价因子与基础因子相关性约57%,基本面因子相关性较低(33%),显示基本面具备明显增量信息。
- alpha158和基本面数据集的因子绩效分别达到多年约20%和24.5%多头超额,表现较基础数据集更突出。
  • 总体结论

- 图网络复杂度和手工因子引入均提升模型预测效果,但图网络提升同时加大多模型之间的相关性,需权衡综合策略。[page::5,6,7]

---

4. 特征集成技术(页8-10)


  • 集成方法

- 采用梯度提升决策树(GBDT)中的三种主流算法:CatBoost、LightGBM、XGBoost,对神经网络生成的因子特征进行集成。
- 通过多维度数据输入、多算法组合及多标签设计,解决单一模型泛化和过拟合问题,增强稳健性。
  • 特征融合技术

- 使用随机“相加”方式而非“拼接”因子特征,避免维度爆炸同时保持多样性。
- 多次重复相加生成多个差异化综合特征集,丰富集成输入。
  • 集成因子绩效对比

- 单一LSTM因子集集成:多头超额收益36.6%,5日IC 11.5%。
- 引入GAT后增加至37.3%,IC持平。
- 增加手工因子后提升至40.4%,5日IC 12.0%,10日IC 13.5%。
- 多次集成(多数据集×多算法×多标签)最终提升至45.4%多头超额收益,5日IC 12.9%,10日IC 14.7%。集成策略显著提高选股模型效能。
  • 集成思路总结

- 多样化输入数据集和模型可显著提升收益预测。
- 多算法结合增强泛化能力。
- 多标签、多预测窗口设计增加模型稳健性。

报告明确提出该集成思路作为最终的深度学习综合选股因子。[page::8,9,10]

---

5. 指数增强组合构建与表现(页10-12)


  • 组合构建框架

- 基于综合选股因子构建中证500和中证1000指数增强组合。
- 采用周频调仓、最大化预期收益为目标。
- 交易成本假定双边千分之3。
- 操作中限制换手率(单次不超过15%,年单边约7.5倍),平衡成本和换手需求。
- 风险控制包括个股权重、行业权重偏离、风格暴露限制等。
  • 中证500组合表现(图表16-17)

- 2019-2023年年化收益24%,超额中证500指数18.6%,跟踪误差5.5%,信息比率2.98。
- 回撤控制合理,月度胜率稳定达78%。
- 最大回撤-27%,超额回撤-6.4%,表现稳健。
  • 中证1000组合表现(图表18-19)

- 5年年化收益33.8%,超额中证1000指数28.1%。
- 跟踪误差略高6.4%,信息比率3.67,月度胜率81.4%。
- 回撤控制健全,超额回撤-6.5%。
  • 总结

- AI模型因子驱动的指数增强策略展现出突出长期超额收益和较高的稳健性。
- 引入图注意力网络和多维度手工特征集成显著提升组合表现。[page::10,11,12]

---

6. 结论与风险提示(页12-13)


  • 总结回顾

- 强调3条提升AI选股模型绩效的核心路径,本文重点探讨了“多模型训练与堆叠因子输出”。
- 结合LSTM与GAT模型充分利用时间序列数据与空间结构信息。
- 手工量价和基本面因子补足神经网络模型不足,带来额外alpha。
- 多维度特征集成策略整合数据输入、算法和标签设计,实现了历史业绩显著提升。
  • 历史表现突出

- 综合深度学习因子多头超额收益达45.4%。
- 中证500/1000增强组合的超额收益分别18.6%和28.1%,信息比率均处于优秀水平。
  • 风险提示

- 结论基于历史数据和模型推演,存在模型失效等风险。
  • 声明

- 本资料仅面向专业投资者,报告内容仅供参考,不构成具体投资建议。
- 版权归国盛证券所有,未经许可禁止转载。[page::12,13]

---

三、图表深度解读


  • 图1-2(页1):展现中证500和中证1000基准与AI增强组合净值走势,AI增强组合显著优于基准,体现强选股能力和超额收益实现。

- 图3(页1):流程图梳理数据到最终组合的完整路径,强调数据处理、模型训练、因子输出与组合构建环节相互依赖。
  • 图4(页4):图注意力网络计算示意,展示如何通过注意力分配识别节点(股票)间的权重,突出GAT捕获复杂关联的优势。

- 因子相关性表(页5):因子内部及不同模型间相关性对比,表现出GAT模型提高因子预测能力同时提升因子共性。
  • 因子绩效表(页6-7):多模型、多数据集下的IC及多头超额收益比较,清楚反映图网络和手工特征集的增益效果。

- 特征合并图(页8):对比“拼接”和“相加”,实际采用随机相加的方式降低特征维度膨胀风险。
  • 因子集成绩效表(页9-10):对比不同因子集、模型及多次集成策略,展示其对收益预测提升的具体量化效果。

- 组合净值图(页11-12):展现两个指数增强组合的净值曲线,稳定超越基准且回撤受控,说明模型有效性强。

所有图表均紧密配合文字阐述,形成多层次、多角度佐证体系。

---

四、估值与风险分析


  • 本报告的核心为模型和策略构建,估值指标未直接涉及,因此无传统财务估值分析。

- 风险方面,作者强调基于历史数据的模型推演可能存在“失效风险”,投资者需注意模型可能不适应未来市场环境变化。[page::13]

---

五、批判性视角与细微差别


  • 优势

- 系统性整合了多模型、多数据源、多标签的多维度集成策略,攻克传统单一方法难以突破的瓶颈。
- 细致的模型架构搭建与数学说明极具专业价值,且结合丰富的实证数据支持。
- 强调融合空间截面信息与时间序列信号,突破了单一时序模型的局限。
  • 潜在不足与审慎点

- 报告多处依赖累计收益及IC指标,虽数值突出,但未详细披露回测中可能的样本内外差异与市场条件变化,存在一定“过拟合”隐忧。
- 对集成过程中特征“相加”操作虽避免维度爆炸,但可能带来信息损失,相关权衡细节未深究。
- 风险提示较为简略,未详述极端行情或模型架构调整带来的具体风险缓解措施。
- 图注意力网络构建邻接矩阵基于行业与风格,但未提及动态调整适应新兴行业或风格迁移的能力。
  • 整体评估

- 报告在技术深度与应用广度兼备,展示了AI模型边际效能提升的前沿路径。
- 读者或投资者在利用结论时,仍应考虑模型的适时更新与多因子策略的风险控制手段。

---

六、结论性综合



本篇报告系统地分析了通过引入图注意力网络(GAT)和多样化手工特征集成,提升基于深度学习的AI选股模型绩效的实际路径。以时序LSTM搭配GAT捕捉股票间复杂空间依赖,再结合量价和基本面手工特征,实现了因子信息的有效增厚。多维度、多模型、多算法、多标签的集成策略显著提升了模型的预测能力与稳健性。

实证数据方面,2019-2023年回测显示,深度学习综合因子实现45.4%的多头超额收益,指标IC均值亦大幅领先基线模型。进而利用该因子构建的中证500和中证1000指数增强组合,分别实现18.6%和28.1%的年化超额收益,信息比率优异,回撤控制有效,体现了模型在实际投资上的优异适用性。

图表数据充分证明了图注意力网络的增效作用及手工特征集成带来的alpha贡献,且多次集成策略的引入进一步放大了选股模型能力。风险管理措施体现在组合权重偏离限制及换手率控制,符合机构投资者需求。

综上所述,报告深入剖析了当前AI选股量化领域提升模型效能的关键技术路径,结合丰富实证,展示了以图神经网络辅助的多模型集成方法在指数增强投资中的实用价值,为量化投资者提供了科学且具操作性的量化策略蓝本。

---
【全文完】

---

参考标注:


相关核心观点及数据均标注对应页:
[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13]

报告