ML-GAT: A Multilevel Graph Attention Model for Stock Prediction
创建于 更新于
摘要
本报告提出一种多层次图注意力网络模型ML-GAT,融合股票历史价格、新闻文本和企业关系数据,利用多层注意力机制选择性聚合不同类型关系信息,显著提升了S&P 500和CSI 300指数股票趋势预测的准确率和盈利能力。实验表明,ML-GAT在F1-score和准确率分别较基准模型提升11.82%和12.6%,日均收益率和夏普比率分别提升5.06%和94.81%。模型可解释性强,关联关系符合实际市场互动 [page::0][page::1][page::4][page::6][page::8][page::9][page::12][page::13]
速读内容
多源数据特征提取与融合 [page::2][page::3]

- 利用LSTM编码历史价格变化率,捕获时间序列的短长期依赖关系。
- 应用BERT对财务新闻进行语义特征提取,提取[CLS]向量作为文本嵌入。
- 通过元路径将Wikidata复杂异构图转换为同构股票关系图,包含多种关系边。
ML-GAT多层图注意力网络设计 [page::4]

- 第一层状态注意力用于不同邻居节点的关系信息筛选,动态计算注意力权重。
- 第二层关系注意力用于给不同类型关系赋予权重,聚合多种关系特征。
- 最终节点表示融合价格向量、新闻向量及关系聚合向量,输入浅层网络分类预测股票涨跌。
关系类型对预测性能的影响分析 [page::7]
| 关系类型 | F1-score |
|------------------------|------------|
| Industry-Legal form | 0.4576 |
| Parent organization-Owner of | 0.4561 |
| Industry-Product or material produced | 0.4552 |
| Owned by-Subsidiary | 0.4547 |
| Founded by-Founded by | 0.4543 |
- 不同关系的引入对预测效果差异显著,最佳关系比最差关系的F1-score高19.11%。
- 仅使用效果较好的10种关系构建股票关系图,提高预测性能。
ML-GAT与基准模型比较:F1-score与准确率 [page::8]
| 模型 | S&P500 F1-score | CSI300 F1-score | S&P500 Accuracy | CSI300 Accuracy |
|---------|-----------------|-----------------|-----------------|-----------------|
| MLP | 0.3568 | 0.3790 | 0.3022 | 0.3589 |
| CNN | 0.3939 | 0.3832 | 0.3278 | 0.3924 |
| LSTM | 0.4004 | 0.4265 | 0.4428 | 0.4028 |
| GCN | 0.4146 | 0.4317 | 0.4421 | 0.4138 |
| TGC | 0.4412 | 0.4509 | 0.4626 | 0.4438 |
| ML-GAT | 0.5102 | 0.5691 | 0.5085 | 0.5698 |
- ML-GAT模型在两个指数的F1-score和准确率上均显著优于其他方法。
- 结合个股关系建模及新闻语义信息显著提升预测准确度。
盈利指标对比:日均收益率与夏普比率 [page::9]
| 模型 | S&P500 日均收益率 | CSI300 日均收益率 | S&P500 夏普比率 | CSI300 夏普比率 |
|---------|-------------------|-------------------|-----------------|-----------------|
| MLP | -0.0006 | 0.0081 | 0.4243 | 0.4824 |
| CNN | 0.0316 | 0.0413 | 0.4272 | 0.4902 |
| LSTM | 0.0288 | 0.0394 | 0.7884 | 0.7547 |
| GCN | 0.0486 | 0.0597 | 0.5180 | 0.5858 |
| TGC | 0.0719 | 0.0828 | 0.8526 | 0.9513 |
| ML-GAT | 0.1193 | 0.1334 | 1.8889 | 1.8994 |
- ML-GAT的平均日均收益和夏普比率均显著优于其它基线模型。
- 模型具有更稳定的盈利表现,回避黑天鹅事件风险能力较强。
量化因子构建与策略关键点总结 [page::4][page::6]-[page::9]
- ML-GAT模型结合价格、新闻和多类型关系,采用多层图注意力机制分别处理邻居节点信息和不同关系重要性。
- 输入编码包括:LSTM处理历史价格,BERT处理新闻语义,元路径转换Wikidata关系图。
- 分类任务目标为预测股票三类走势(上涨、持平、下跌),基于softmax输出概率。
- 交易策略基于最高预测概率执行买入、卖出或持有操作,模拟投资组合回测结果优异。
- 从统计数据和交易策略的实验结果看,模型予以适应不同市场环境,提升超额收益能力。
关键图示解读

- 结合BERT新闻特征提取,模型F1-score提升18.08%,准确率提升11.54%,平均日收益提升2.3%。

- S&P 500组合持仓资产价值变动,ML-GAT显著领先其他模型,表现出强劲抗风险能力。

- CSI 300组合资产值随时间提升趋势明显,ML-GAT相较其他模型具有更高的资产增值潜力。
深度阅读
ML-GAT: A Multilevel Graph Attention Model for Stock Prediction ——深度分析报告
---
1. 元数据与概览
- 报告标题:ML-GAT: A Multilevel Graph Attention Model for Stock Prediction
- 作者及机构:Kun Huang(浙江科技学院理学院)、Xiaoming Li(浙江越秀外国语学院国际商学院)、Fangyuan Liu(UCSI大学商业管理学院)、Xiaoping Yang、Wei Yu(浙江越秀外国语学院国际商学院)
- 发布时间/支持:报告中无明确发布时间,文中提及相关基金项目支持,时间点集中于2022年。
- 研究主题:股票趋势预测,聚焦基于图神经网络(Graph Neural Network,简称GNN)技术,结合多维数据(历史价格、财务新闻及公司关系)的股票市场趋势预测模型。
- 核心论点:
- 现有研究过于依赖历史价格特征,缺乏对新闻与公司间复杂关系的有效建模。
- 作者提出利用多层次图注意力网络(ML-GAT),可融合多源信息,有选择性地加权不同关系类型以提升预测性能。
- 通过实证,ML-GAT在S&P500与CSI300两个主要指数中对423与286只股票趋势预测表现出优异的F1-score和准确率,平均日收益率与Sharpe比率显著提升,且模型中不同股票的关系解释性强,符合实际经济理解。
综上,报告强调融合异构金融信息、对关系多样性赋权,以及结合法律现象改进图学习是股票趋势预测提升的关键点。[page::0],[page::1]
---
2. 逐节深度解读
2.1 摘要和引言
摘要指出传统方法主要关注历史价格特征聚合进图网络,忽略了实时新闻事件等外部信息,其构建的股票关系多为手工制定,难以捕获复杂股票关系,被动限制了预测能力。为此,提出ML-GAT框架,结合文本(BERT编码)、数值价格特征(LSTM编码)及公司关系(Wikidata多关系),通过多层图注意力机制,有选择性地整合多类型关系特征提升预测表现。
引言部分进一步强调,股票非孤立存在,且领先股能够对行业整体带动影响,说明考虑股票间关联性必不可少。现有研究常针对单只股票,未充分利用网络中的多关系信息,忽略新闻、事件等多源信息融合成为性能瓶颈。[page::0],[page::1]
2.2 相关工作(Literature Review)
- 股票市场预测:综述了传统的统计与机器学习(如SVM、RF)和深度学习模型(CNN, RNN, LSTM)。近几年大多基于时序特征预测价格,但未充分考虑非结构化文本及股票间多关系。
- 财经文本表达:历史方法从词袋模型向Word2Vec、GloVe演进。BERT预训练模型在本研究中被引入金融文本特征提取,其双向Transformer结构能捕获深层语义关系,尚未与GNN深度融合。
- 图神经网络在金融场景中的应用:已有研究将公司关系引入GNN,如Chen等将公司关系作为图卷积的边结构;Feng等引入时间敏感图卷积;Kim等利用堆叠GNN捕获时间序列和全局信息。然而,这些方法大多未区分不同关系的信息贡献度,未利用多重注意力机制赋权关系数据。
总体来看,文献表明市场信息多样且复杂,基于异构图的多关系建模和多维信息融合对提升预测性能至关重要,而ML-GAT运用BERT+多层图注意力机制填补了该领域空白。[page::1],[page::2]
2.3 方法论
整体框架包含特征提取模块、关系图建模模块和预测层三部分(图1)。
- 特征提取模块包括:
- LSTM编码:输入为股票历史收盘价变动率序列,用来捕捉价格的短长期时序依赖性。模型具体结构包括输入序列嵌入、递归更新隐藏状态和最终采样最后隐藏层作为特征表征。时间序列长度为S,输入特征维度为D,输出嵌入维度U。
- BERT编码:将每只股票对应的历史新闻文本序列进行句子级预处理(添加[CLS],[SEP]),使用预训练BERT模型提取新闻文本的语义特征,输出作为文本特征向量。该方法弥补了以往图神经网络处理文本信息能力弱的不足。
- 关系提取模块:以Wikidata知识库为数据源,提取多种股票间的公司关系,处理异构图结构,利用元路径(meta-path)简化异构图为同构图,通过最大两跳的随机游走转移概率学习节点关系嵌入。
- 关系图建模模块(ML-GAT):
传统的GNN均等处理邻居节点信息,无法区分不同股票关系的重要性,而多种关系间存在信息冗余甚至干扰。ML-GAT设计了双层多头注意力机制:
1. 状态注意力层(first-level):基于节点i与邻居j在特定关系类型rm下的节点特征和关系嵌入,通过可学习参数加权,计算不同邻居节点对于目标节点的关系权重。
2. 关系注意力层(second-level):将第一层得到的多个关系类型的汇总信息与原节点和关系类型嵌入合并,赋予不同类型关系重要性权重,从而完成多关系间的选择性整合。
最终得到股价和新闻特征的综合节点嵌入,通过浅层神经网络进行股票未来趋势(涨/平/跌)分类预测,采用交叉熵作为损失函数完成模型训练。
该方案创新点在于引入多关系选择性整合,利用BERT提升文本理解,结合多层次图注意力实现异构信息的高效融合。模型结构详见图2。[page::2],[page::4],[page::5]
---
3. 图表深度解读
3.1 图1:整体框架流程图(page 3)
- 描述:图示股票预测方法结构,左侧为三个特征提取模块:价格数据经过LSTM编码,文本数据(新闻)经BERT编码,关系数据(Wikidata)经关系抽取模块;中间为ML-GAT模块实现多层图注意力机制对关系图信息聚合;右侧为预测层输出股票涨跌预测。
- 解读:该流程图清晰展示了多源输入如何被分别编码,随后按类型嵌入股价关系图,最终利用ML-GAT汇聚各类信息完成趋势预测。体现了模型模块化设计,突出三维数据融合。[page::3]
---
3.2 图2:ML-GAT详解结构图(page 4)
- 描述:分三部分展示ML-GAT核心:
1. Feature Embedding:股价嵌入和新闻文本嵌入分别映射并附加于股票节点。
2. Stock Relationship Network:多关系构成的同构股票图,带有节点特征。
3. 多层注意力机制层(图神经网络层->状态注意力层->关系注意力层->预测层),抽取最终预测向量。
- 解读:图示体现多层次注意力机制对不同邻居节点和不同关系类型的权重赋值,实现有效特征筛选。模型通过多层注意力机制动态调整多样化股票之间复杂的影响关系权重,是该模型核心创新。整体结构图深化了报告描述的模型流程和细节。[page::4]
---
3.3 数据表1(page 5):历史价格数据统计
- 描述:表格列明两大指数(S&P500和CSI 300)股票数量及分割的训练、验证、测试日数。分别为423只和286只股票,训练期1080天,验证213天,测试316天。
- 解读:样本涵盖数量大,时间跨度长期,有利于模型捕捉多时期价格演化和特征。区分训练-验证-测试集保证实验结果可靠性。[page::5]
---
3.4 表3和表4(page 7):最优与最差的10种关系的预测效果(F1-score)
- 描述:表3为表现最好的10种Wikidata关系类型(如“Industry-Legal form”,“Parent organization-Owner of”等),F1-score约0.45左右;表4列出最差的10种关系(如“Board member”,“Stock Exchange”等),F1-score低至0.26-0.31。
- 解读:关系类型对预测贡献显著不同,部分关系甚至可能带来噪声,导致预测性能下降。说明关系选择和权重分配的重要性。ML-GAT利用多层注意力机制对关系赋权,便于过滤低贡献关系,提高整体准确率。[page::7]
---
3.5 表5(page 8):不同模型在S&P500与CSI300股票趋势预测中的分类准确率和F1-score
- 描述:对比了MLP、CNN、LSTM、GCN、TGC和ML-GAT在F1-score和准确率上的表现。ML-GAT在两个指数中F1-score和准确率均最高,分别达到0.5102,0.5691 (F1) 和0.5085,0.5698(准确率),领先明显。
- 解读:非图模型如LSTM表现尚可,但未充分利用关系信息。GCN普遍优于普通非关系模型但存在不稳定现象。ML-GAT通过多层加权显著提升性能,证明多源融合和多级注意力机制的有效性。[page::8]
---
3.6 表6(page 9):模型盈利能力测试——平均日收益率和Sharpe比率
- 描述:体现不同模型构建的投资组合的平均日收益率和风险调整收益率(Sharpe比率)。ML-GAT在两个指数中日均收益率分别为约11.9%和13.3%,Sharpe比率远高于其他模型(约1.88和1.9),表现最优。
- 解读:金融预测最终目的为提高投资回报,表6中的收益率和Sharpe比率直接反映了模型在实际交易中的潜力。ML-GAT不仅提升了分类准确率,更带来了显著的投资收益改进与风险控制能力。该结果印证模型实际应用价值。[page::9]
---
3.7 图3(page 9):S&P500股票中包含新闻信息与否的模型性能对比
- 描述:使用条形图展示ML-GAT在加入BERT新闻特征和不加入两种情况下,F1-score、准确率、平均日收益率和Sharpe比率的表现。
- 解读:新闻信息加入后,F1-score提升18.08%,准确率提升11.54%,平均日收益率提升2.3%。显示新闻文本特征提升预测性能的重要性。然而,Sharpe比率反而略降,可能因新闻数据稀疏引起风险测度不稳定。提示新闻信息虽提升预测,但需进一步优化其应用方式。[page::9]
---
3.8 图4&图5(page 10):资产价值随时间变化曲线(S&P500 & CSI 300)
- 描述:以初始资产为1000,比较MLP、CNN、LSTM、TGC、GCN和ML-GAT模型预测策略下资产价值随时间的累积变化。ML-GAT曲线明显高于其他模型。
- 解读:模型能够适应2018年末的市场剧烈变动(比如土耳其金融危机、新冠疫情),有效减亏且实现盈利。ML-GAT结合多维信息展现出超强的抗风险和盈利能力,验证其在现实市场的实用性和鲁棒性。[page::10]
---
4. 估值分析
本报告为方法学与实验研究型报告,未包含传统意义上的财务估值分析(如DCF、P/E倍数法等),主要聚焦于机器学习模型的性能度量与效果展示,围绕预测准确率和交易策略回报展开。因此,估值分析不适用。
---
5. 风险因素评估
报告对风险因素未进行专门章节阐述,但从内容可见:
- 信息稀疏性:新闻活动经常不均衡,信息不连续,影响文本特征稳定性,进而影响投资风险(如Sharpe比率下降的问题)。
- 关系数据质量及选择性风险:非所有股票关系均有益,低质量及不相关关联可能带来噪声。模型须加权筛选,否则预测性能下降。
- 市场极端事件影响:股市黑天鹅事件带来非线性冲击,模型需要足够灵活捕捉突发信息。
报告建议未来工作将通过选择更优特征编码、关系构建方法来缓解上述风险。[page::12],[page::13]
---
6. 批判性视角与细微差别
- 新闻文本处理的局限性:尽管加入了BERT编码实现文本理解,因文本数据的稀疏性及异质性,其对Sharpe比率的提升有限,说明模型对新闻的利用还有潜力可挖,可能需要结合更细粒度的事件建模和文本预处理。
- 关系数据选取的经验性:虽然指定了10种优质关系以提升图谱表达,依赖Wikidata构建关系网络可能面临数据缺失、更新滞后问题。同时二阶关系的多样性复杂,如何更系统地做路径及关系筛选仍是难点。
- 黑箱性与解释性:报告声称模型对关系权重具解释性,但具体解释机制和结果未充分展开,实务中可解释性仍需加强。
- 模型对不同市场适应性:报告覆盖美股和中国股市两大市场,但市场结构和规则差异极大,模型统一参数设置可能不足以充分捕获市场异质性,建议未来考虑市场特定策略。[page::9],[page::10],[page::13]
---
7. 结论性综合
本文提出的多层次图注意力网络(ML-GAT)通过引入多源信息(历史价、新闻文本及多样化公司关系)融合的创新框架,显著提升了股票市场趋势预测能力。深度特征提取模块(LSTM编码价格序列,BERT编码新闻文本)与多层、多类型关系注意力机制相结合,有效地对复杂股票关系赋权和信息筛选,克服了传统图卷积一视同仁困境。
实验验证中:
- 关键性能指标,如F1-score和准确率均超越五种主流基准模型(MLP、CNN、LSTM、GCN、TGC),对S&P500和CSI300上的表现分别提高约11.82%和12.6%。
- 交易策略回测显示ML-GAT带来的平均日收益率提升5.06%,Sharpe比率提升接近95%,意味着收益的同时风险控制显著优化。
- 财务新闻信息的引入提升了模型性能,尽管在风险调整收益指标上仍存优化空间。
- 对不同股票关系的加权区分保障模型聚焦核心影响股票之间的真实互动,提高预测的解释力和实用性。
整体来看,ML-GAT模型通过跨领域技术融合和关系数据富集,成功实现了股票趋势预测的质的飞跃。研究对推动图神经网络在金融领域的应用具有示范意义,未来可向更丰富的多模态信息融合、关系构建和风险防控等方面深化。
模型框架详见图1与图2,展现了从特征提取到多层注意力机制聚合再到预测的完整流程。表4-6中数据清晰反映了关系权重筛选的必要,以及模型在分类和实际回报上的领先优势。图3-5进一步支持了新闻文本信息和交易策略中的实证效用。
最终,本报告验证了结合多层次图注意力机制与跨源特征编码(BERT与LSTM)能够显著提升股票市场趋势预测的准确性和投资回报能力。[page::0-13]
---
参考图示
- 图1 ML-GAT整体框架:

- 图2 ML-GAT详细结构:

- 图3 ML-GAT带或不带新闻信息比较:

- 图4 S&P 500资产价值变化曲线:

- 图5 CSI 300资产价值变化曲线:

---
【完】