`

NGAT: A Node-level Graph Attention Network for Long-term Stock Prediction

创建于 更新于

摘要

本文提出了一种面向长期股票收益率与波动率预测的节点级图注意力网络(NGAT),通过为每个公司节点赋予独特的注意力机制,有效建模公司关系图中不同节点的异质特征。该方法弥补了传统图模型泛化能力差和下游任务单日预测局限,显著提升预测准确率和波动率拟合度。实验基于两个公开数据集验证,NGAT在多周期预测任务中均优于传统GNN和基准方法,且显示了不同图构造方式下的模型鲁棒性,支持长期投资策略制定 [page::0][page::1][page::6][page::7][page::9]。

速读内容


长期多周期股票趋势与波动率预测任务设计 [page::2][page::3]

  • 任务将未来T个交易日的平均对数收益分段分类为涨升、反弹、回撤和暴跌四种情形,支持更长远的趋势研判。

- 波动率预测采用未来T日收益样本标准差的回归方式测算,合并趋势与波动率预测增强风险评价。

NGAT模型结构与创新点 [page::4][page::5]


  • 利用LSTM捕获时间序列特征,节点级注意力机制针对每个股票个性化设定权重,避免传统GAT对节点异质性的忽视。

- 关系图边基于新闻/推文共现构建,并引入时间加权平均实现记忆窗口,增强近期信息权重。
  • 多头注意力机制结合节点自身和邻居特征并行学习,利于捕捉复杂异构关系。


实验数据与基线比较 [page::6]

  • 数据集含ACL2018(推文+股票数据,76家公司)和SPNews(新闻+股票数据,268家公司)。

- 对比模型包含LSTM、GCN、GAT、TGC、AD-GAT等,覆盖非图与图结构模块。

长期趋势分类与波动率预测性能表现 [page::7][page::8][page::9]


| 数据集 | 模型 | r-mean21准确率(ACC) | MCC | AUC | 波动率预测R^2(T=21) ACL2018 | SPNews |
|---------|-------|---------------------|------|-------|-------------------------|--------|
| ACL2018 | NGAT | 69.60% | 0.38 | 0.80 | 0.45 | 0.38 |
| | GAT | 67.89% | 0.36 | 0.79 | 0.40 | 0.33 |
| SPNews | NGAT | 73.97% | 0.42 | 0.81 | 0.38 | 0.30 |
| | GAT | 71.51% | 0.34 | 0.75 | 0.33 | 0.33 |
  • NGAT在不同时间窗口预测任务中精度领先,回避危机的“暴跌”(LN,N-)和捕捉“涨升”(LP,N+)表现尤为突出。

- 波动率预测中,NGAT在两数据集均表现最优,体现对复杂市场风险的敏感捕捉能力。

关联图构建方法影响分析 [page::9]


| 构建方式 | GAT R^2 (std21) | NGAT R^2 (std21) |
|--------------------|-----------------|------------------|
| 静态图 | 0.3350 | 0.3746 |
| 5天相关系数(记忆窗口) | 0.2645 | 0.3607 |
| 5天共现图 | 0.3505 | 0.4239 |
| 21天相关系数 | 0.1773 | 0.3695 |
| 21天共现图 | 0.2856 | 0.3591 |
  • NGAT显著减少图结构构建缺陷对性能的影响,记忆窗口约5天效果最佳。

- 传统GAT更依赖于优质图结构,反映出模型对图质量敏感性差异。

主要结论 [page::7][page::9]

  • 节点级专属图注意力机制适应异质财务节点特征,实现更精准长期趋势与波动率预测。

- 长期预测任务超过单日预测,符合动量溢出延迟特性,提升投资决策信息价值。
  • NGAT具备良好的泛化性与鲁棒性,为基于图的金融量化预测提供有效架构。

深度阅读

报告详尽分析:NGAT——面向长期股票预测的节点级图注意力网络



---

1. 元数据与概览


  • 标题:NGAT: A Node-level Graph Attention Network for Long-term Stock Prediction

- 作者及机构
- Yingjie Niu 等,分别隶属于都柏林大学学院计算机科学学院、都柏林城市大学数学科学学院以及都柏林大学学院商业学院 [page::0]
  • 发布时间:论文或报告未明确标注具体发布日期,但参考文献及引用显示研究最早至2024年,项目代码已公开,具备较新前沿性 [page::0] [page::9]
  • 研究主题

- 研究企业关系构成的图结构(Corporate Relationship Graphs,CRGs),通过节点级图注意力网络(NGAT)提升股票长期回报和波动率的预测准确性。
  • 核心论点与贡献

1. 建立了适合捕捉动量溢出效应的长期股票回报和波动率预测任务(突破传统只做次日预测的局限)。
2. 提出一种与企业特性高度契合的节点级注意力机制(NGAT),区别于传统共享注意力机制,更适应节点(公司)异质性强的CRGs。
3. 系统性实验验证NGAT在多个数据集和任务上优于现有主流模型(包括传统图卷积和注意力模型)。
4. 探讨并演示了基于下游任务性能评判图结构质量的局限性,表明高效模型能部分掩盖图结构缺陷。

综上,作者围绕图神经网络在财务领域股票长期预测的适用性、模型设计以及图构建方法的科学评估展开创新,强调了关系图的合理设计与节点间个性化注意力机制对提升金融预测的关键作用。[page::0][page::1]

---

2. 逐章深度解读



2.1 摘要与引言


  • 摘要聚焦图表示学习在企业关系图中的应用痛点:

- 下游任务设计不合理导致关系信息优势受限。
- 现有模型复杂且泛化能力差。
- 依经验默认图结构缺乏科学比较标准。
  • 引言进一步阐述以上三大挑战:

1. 目前多着眼于次日趋势预测,未充分利用股票间动量溢出效应的时滞及长期性质,且多数关注回报忽视波动率(风险)。
2. 图神经网络架构未充分考虑公司之间异质性,采用统一参数忽略节点差异,设计的专用模型往往过于复杂,不具备广泛适用性。
3. 图构建方法缺乏标准化评估,通常依赖经验,难以判断最优网络结构。
  • 逻辑支撑

- 股票市场中企业相互影响存在时间滞后,单日预测忽略了该经济现实。
- 公司差异性决定了注意力机制应个性化,才能准确捕捉个别企业的关联影响。
- 下游任务性能不能全面衡量图结构质量,需新颖评估指标和方法。
  • 结论:提出长期股票预测任务与基于节点级注意力的NGAT模型,致力于提升CRGs的预测能力和模型的普适性。[page::0][page::1]


2.2 相关工作(Section 2)


  • 任务演变:从经济计量模型(因子分析、GARCH类波动率模型)到基于机器学习的混合模型(例如GARCH与神经网络结合),再到时序模型(LSTM等)扩展至非短期任务(如排序任务、隔夜预测等)[page::2]
  • 图神经网络应用:利用文本信息、价格关联、行业分类等构建图,应用GCN、GAT及其变种捕捉企业间的动态影响,但存在复杂度高和泛化差的矛盾[page::2]
  • NGAT定位

- 通过节点级的个性化注意力权重设计解决泛化瓶颈,且结构相对简单易于迁移应用。
- 融合股票长期回报和波动率预测,扩展传统次日趋势预测框架。[page::2]

2.3 问题定义与任务设定(Section 3)


  • 长期预测任务

- 回报趋势预测设为分类任务,判断未来T天平均对数收益是否高于过去T天,刻画四种市场情境:
- (LP, N+): 上期正收益,未来表现更好,“爆发”;
- (LN, N+): 上期负收益,未来改善,“反弹”;
- (LP, N-): 上期正收益,未来走弱,“回撤”;
- (LN, N-): 上期负收益,未来更差,“下跌”。
  • 波动率预测

- 采用未来T天收益对数收益的样本标准差作为波动率估计,作为连续回归任务。
  • 金融意义

- “N+”情况对应市场机会,建议持有或增持;
- “N−”代表风险信号,提示减仓或做空。
  • 创新点

- 设计长期(多日)区间预测,突破传统仅短期(次日)判断,更贴合现实动量溢出分布。
- 结合回报与波动率的联合预测,帮助投资者评估收益与风险的动态关系,优化策略制定。

此部分构建了整个模型设计与评测的理论依据和任务目标框架。[page::2][page::3]

2.4 模型架构(Section 4)


  • 顺序嵌入(4.1)

- 使用LSTM编码每只股票历史交易特征序列形成时间依赖嵌入,输入为时间步长$\Delta d$内的特征矩阵,输出为该时间步最后隐藏层向量。
  • 关系嵌入(4.2)

- 利用企业间新闻或推文中共同出现构建关系边,统计每日共同出现次数并引入时间加权的衰减机制(定义时序加权关系$\hat{R}d^{(i,j)}$)以突出近期信息。
- 推出节点级图注意力层:
- 关键区别在于每个节点拥有独立的注意力机制参数$a
i$,打破传统共享参数假设,针对CRG中节点异质性进行了专门设计。
- 通过线性变换映射查询、键、值向量,计算加权注意力分数(结合时间加权关系强度),经过LeakyReLU激活后归一化得到邻居权重$\beta{ij}$。
- 结合自身节点特征及邻居加权特征进行拼接后线性映射并加非线性激活,使用多头机制稳定模型。
  • 输出层(4.3)

- 根据任务目标,输出为回归或分类分支,分别采用均方误差和二元交叉熵作为损失函数。
  • 总结

- 模型设计兼顾了时序序列信息与企业间基于文本共现关系的结构化信息。
- 节点级定制化注意力机制有效适应股票多样化特征,缓解传统图注意力共享参数的泛化困境。

此模块构筑了完整的股价动态+企业关系融合预测体系,兼具灵活性和针对性。[page::3][page::4][page::5]

---

3. 图表与表格深度解读



3.1 图1:NGAT模型架构及计算流程(page::4)


  • 描述

- (a) 展示根据新闻文本共现构建的动态关系图;
- (b) 显示由LSTM生成的股票顺序嵌入;
- (c) NGAT节点级注意力层计算细节,含多头注意力;
- (d) 输出层分为回归和分类两路径。
  • 数据及逻辑

- 关系矩阵结合时间加权体现了新闻共现关系的时变特征;
- 节点特定注意力参数$\mathbf{a}
i$令每家公司基于邻居特征赋予不同权重,突破均质假设;
- 多头机制增强模型稳定性和表达力。
  • 联系文本

- 图中设计直接映射Section 4模型描述,具体步骤清晰支撑NGAT的创新点。
  • 潜在局限

- 图中的加权机制假设时间窗和权重设计合理,但对极端新闻事件的敏感度未详述;
- 气泡大小与连接强度等可视变量未标明,留待进一步量化分析。



3.2 表1:长期收益趋势分类预测性能对比(page::8)


  • 描述:展示不同预测周期(T=1,5,10,21)下,NGAT及各基线模型在ACL2018和SPNews数据集上的准确率(ACC)、马修斯相关系数(MCC)、AUC。
  • 解析

- NGAT在大多数预测周期和指标上领先,尤其T=21时ACL2018数据集ACC提升4%+,SPNews提升2-8%不等,显示长期趋势捕捉能力优越。
- 所有模型准确率均超过70%,显著优于传统50-60%次日预测基准,表明长期预测更具可行性和实用价值。
- MCC和AUC均维持在高水平,体现分类结果均衡,非单纯受样本偏倚影响。
- AD-GAT表现较差,因其未使用文本嵌入,与设计初衷不符。
  • 结论

- NGAT节点差异化注意力机制有助捕获多期间的动量溢出,适应性强。
- 长期预测虽准确度稍降,但实际贡献更大,利于投资者制定中长期持仓战略。

3.3 表2:各类市场情景下回报预测准确率(page::8)


  • 描述:基于四个情景(LP/N+, LN/N+, LP/N-, LN/N-)分析NGAT与LSTM模型在不同预测期的准确率。
  • 解读

- NGAT在“爆发”和“暴跌”场景上表现明显优于LSTM,关键期望风险与机会的捕捉更为准确。
- 反弹(LN/N+)稍逊于LSTM,提示模型可能在某些上涨复苏判断稍弱。
- 不同数据集表现差异,小范围波动在预判策略上提醒需注意模型场景差异。
  • 投资意义

- 优异的风险识别能力对防范巨大损失及获取暴涨收益价值显著。

3.4 表3:波动率预测性能指标(page::9)


  • 描述:展示不同模型在波动率预测任务下$R^2$和MSE指标,含ACL2018和SPNews两个数据集及多个预测周期。
  • 分析

- NGAT在多数情况下$R^2$最高,MSE最低,性能显著优于传统LSTM及其它图模型。
- 图模型优于序列模型在ACL2018中表现明显,说明关系信息关键。
- SPNews数据新闻图噪声较大,增益相对较少,但NGAT依然稳定提升,显示其鲁棒性。
- 长期(月度即T=21)波动率预测优于短期,符合金融风险分析实践。

3.5 表4:不同图结构构建方法对性能影响(page::9)


  • 内容:对比静态图、基于收益相关性和文本共现构建的图对GAT和NGAT性能的影响。
  • 观点

1. NGAT性能全线优于GAT,节点级注意力机制架构优势突出。
2. 5日窗口的记忆长度理想,体现信息时效性对关系建模的关键影响。
3. NGAT能部分缓解图结构缺陷,降低下游任务性能对图质量辨别的依赖。
4. GAT下更偏好共现图,NGAT差异减弱,强调高级模型在信息抽取上的自主补偿能力。
  • 总结:验证了图结构质量影响预测性能,但先进模型能缓冲一定不足,提示未来图结构标准评估仍需深化理论方法。[page::9]


---

4. 估值分析



此论文属于算法模型、金融预测任务创新,无直接估值内容,未涉及现金流折现、PE倍数等传统金融估值指标。其评估重点在模型性能指标及通用适应性,对财务估值无涉及或需求。

---

5. 风险因素评估



论文隐含风险主要涵盖:
  • 图结构构建风险:文本来源数据 noisy,关系边误差可能影响模型输入质量,尽管NGAT有一定缓冲能力[page::9];

- 模型复杂度与泛化性:NGAT相较传统复杂模型,复杂度有所提高,但依赖于固定资产池,扩展至全市场或高频数据时计算成本提升可能受限[page::10];
  • 数据局限性风险:数据源依赖特定市场(如美国S&P500),迁移到其他市场需再验证有效性;

- 预测不确定性:金融市场本身波动无常,模型虽提升均值性能,但短期极端事件的预测仍具挑战;
  • 过拟合风险:尽管施加dropout和正则,但模型参数量较大,训练中的过拟合可能影响实际部署。


报告未明确提出风险缓解策略或相关概率量化,提示未来研究需加强风险管理。[page::9][page::10]

---

6. 审慎视角与细微差别


  • 潜在偏见

- 聚焦新闻和推文共现构建关系可能遗漏更深层次的经济联系(如供应链、管理层重叠),暗示模型对文本质量极度依赖,可能存在数据偏差。
- 文本清洗过程中去除重复出现的同公司ticker,虽然合理,但可能弱化该公司在事件中的重要度表达。
  • 方法限制

- 任务设计虽较次日预测先进,但长周期预测也降低了短期精度,造成平衡挑战。
- 节点级注意力虽然个性化强,但模型参数整体现代市场动态可能需要更灵活的自适应设计,目前设计固定;
- 表4中“下游任务性能无法充分评估图质量”的观点虽合理,但缺少提出新的图质量评估机制,存在方法延伸空间。
  • 内部一致性

- NGAT在不同数据集及任务均展现领先,但对某些细分场景准确率轻微劣于简单模型,强调模型在实战中应结合多模型策略。
- 论文多处强调节点层级差异性,支持理论逻辑与实验结果匹配,整体论证严谨。

---

7. 结论性综合



本文对NGAT模型构建和长期股票预测任务做了系统设计与验证,主要结论包括:
  • 创新成果

- 首次提出长期回报趋势与波动率双任务,充分揭示股价动量溢出长期影响;
- 开发专门适应CRG的节点级注意力机制,区别于传统共享注意力,显著提高预测准确度和模型普适性;
- 通过ACL2018和SPNews两个金融相关文本与交易数据集的实证验证,间接评判图构建方法优劣,指出下游任务反馈不足以完全衡量图质量;
- NGAT在回报趋势和波动率预测均超越现有主流图模型及纯序列模型,特别是长期(如21个交易日)预测维度上优势明显;
- 模型设计兼顾了时间衰减的关系强度计算(记忆窗口权重)、多头注意力机制、防止过平滑的拼接方案,保证了结构创新与优化平衡。
  • 图表见解

- 图1展示了基于企业新闻共现动态关系的带时间衰减权重图,映射至个性化多头注意力机制,完善结合结构信息与时间序列数据的复杂交互过程;
- 表1、表3数据显示NGAT在分类和回归两个任务多周期评测中均领先其他模型,尤其表现出对多样市场情景的较好适应性;
- 表4分析了不同图构建法对模型性能的影响,揭示模型设计对图质量评议的缓冲作用,提醒未来图构建及评估需引入更全面手段。
  • 总体评价

- 报告充分展示NGAT的创新能力及金融预测实用价值,为图深度学习在金融领域的长期应用提供了有力支持;
- 结合长期趋势和风险波动预测,能够更好地辅助投资决策,适应机构投资者中长期资产配置需求;
- 虽模型复杂度增加,但对于固定资产池机构投资者仍属可控。

---

总结



本报告围绕节点级图注意力网络(NGAT)的设计与应用,提出了创新的长期股票回报趋势与波动率预测任务,弥补了传统股票预测任务局限。NGAT通过每个节点独立的注意力机制设计,更加适应节点高度异质的企业关系图,显著提升预测性能。实验证明,该模型在多数据集、多任务、多预测周期上均超越传统图神经网络和纯序列模型,尤其在掌握多样市场情景和风险管理方面效果突出。此外,报告卓有成效地揭示了图结构构建与模型性能评估之间的复杂关系,指出单纯下游任务指标对图质评判的不足。整体而言,NGAT为金融图神经网络研究和实践提供了重要参考框架及工具,实现了模型设计、任务创新到实证分析的闭环,具备较强的科学价值与应用潜力。[page::0][page::1][page::2][page::3][page::4][page::5][page::6][page::7][page::8][page::9][page::10]

报告