`

STOCK PRICE PREDICTION USING A HYBRID LSTM-GNN MODEL: INTEGRATING TIME-SERIES AND GRAPH-BASED ANALYSIS

创建于 更新于

摘要

本文提出了一种将长短期记忆网络(LSTM)与图神经网络(GNN)融合的混合模型,结合时间序列与股票间关系数据,显著提升了股价预测的准确性。经扩展窗口验证训练,该模型在历史数据上的均方误差(MSE)为0.00144,较单独LSTM模型降低了10.6%。相较线性回归、卷积神经网络(CNN)和全连接网络,混合模型表现出更强的鲁棒性和泛化能力。该研究证明结合时序动态和股票关联性是提升金融市场预测效果的有效途径,为实时交易和风险管理提供了有力工具 [page::0][page::1][page::4][page::6][page::7][page::8][page::9][page::10].

速读内容

  • 研究提出将LSTM与GNN结合的混合模型,用于股票价格预测,LSTM捕捉时序依赖,GNN基于Pearson相关系数和关联规则捕捉股票间复杂关系 [page::0][page::4].

  • 数据采集涵盖2005-2023年10只代表性股票,采用Min-Max归一化处理,LSTM输入为连续的收盘价序列,GNN输入为基于线性和非线性关系构建的股票图 [page::3][page::4].

  • 训练策略采用扩展窗口验证,每次在测试后加入最新数据进行增量训练,保证模型对市场变化具备较强适应性 [page::5].

  • 超参数调优确定学习率0.005、批量大小11、训练40-50轮次,采用早停防止过拟合,损失函数为均方误差(MSE) [page::6].

- 实验结果显示混合模型MSE为0.00144,较单独LSTM的0.00161降低10.6%,且优于线性回归(0.00224)、CNN(0.00302)、DNN(0.00335)[page::7].
  • 各模型对不同股票的表现呈现明显差异,混合模型在所有股票上均表现出最低的MSE,体现了其稳健性和广泛适用性,尤其在波动较大的AMD、CMCSA和INTC股票上表现尤为优异 [page::8].

  • 扩展窗口训练方法有助于模型持续适应市场新变化,缓解概念漂移,提升泛化能力。LSTM负责时间依赖关系建模,GNN捕捉股票间关系,实现时序和关系建模的有效融合 [page::8][page::9].

- 模型存在较高计算复杂度和频繁重训练带来的性能开销问题,挑战实时高频交易应用场景,需要未来研究关注高效训练方案和模型简化 [page::9].
  • 本研究模型可支持算法交易、投资组合优化和风险管理,未来可引入宏观经济指标、新闻情绪等多模态数据扩展模型表现与应用范围 [page::9][page::10].

深度阅读

金融研究报告深度分析


报告标题: STOCK PRICE PREDICTION USING A HYBRID LSTM-GNN MODEL: INTEGRATING TIME-SERIES AND GRAPH-BASED ANALYSIS
作者: Satishbhai Sonani, Atta Badii, Armin Moin
所属机构: University of Reading (UK), University of Colorado Colorado Springs (USA)
发布时间: 未明确注明具体日期,但时间范围至少涵盖至2023年底
研究主题: 利用长短期记忆网络(LSTM)和图神经网络(GNN)的混合模型,结合时间序列和基于图的分析,提高股票价格预测精度

---

1. 元数据与概览



本文提出一种混合模型,通过整合LSTM与GNN,充分利用时间序列数据的动态变化和股票间的复杂关系,提高了股价预测的准确度。LSTM负责捕获单支股票价格的时间动态,GNN利用皮尔逊相关系数及关联分析构建股票关系图,刻画股票间的非线性多方依赖。评估结果显示,混合模型的均方误差(MSE)为0.00144,相比单独LSTM模型(MSE 0.00161)降低约10.6%。此外,混合模型优于线性回归、卷积神经网络(CNN)和简单全连接网络(DNN)等基准模型,体现出结合时间与关系信息的显著优势。作者强调该模型在实时交易和金融分析中具备强大潜力。

关键词: 股票预测、LSTM、GNN、混合模型、时间序列分析、金融预测、机器学习

核心信息传递是:股票价格受多重复杂因素影响,单纯的时间序列模型难以表现,而结合关系网络的混合深度学习模型能显著提升预测性能。[page::0] [page::1]

---

2. 逐节深度解读



2.1 引言 (Section 1)


  • 关键论点:

- 股票市场因多重复杂因素(宏观经济指标、地缘政治事件、企业新闻、环境灾害等)影响呈现高度非线性和不可预测性。
- 传统统计和线性模型无法充分捕捉非线性、多因子交互作用。
- LSTM因其对序列长依赖的建模能力,在金融时间序列预测中展现优势。
  • 推理依据:

- 文献引用了Fama(1970)等经典,指明市场的复杂性及非线性特征。[page::0]

2.2 传统与先进方法回顾 (Section 2)


  • 统计方法限制: 线性回归和自回归模型难以捕捉复杂依赖,机器学习特别是深度学习成为主流。

- LSTM优势: 能缓解梯度消失,捕捉长时间依赖关系,在非线性时间序列预测中优于ARIMA等模型。
  • 图神经网络(GNN)角色: 通过理解股票间关系建模复杂依赖,弥补单纯时间序列模型的不足。

- 混合模型趋势: 结合LSTM和GNN实现时间和关系的双重建模,提升预测准确率。
  • 数据预处理挑战: 财务数据噪声大、缺失多,预处理和超参数调优至关重要。[page::1] [page::2]


2.3 模型选择与训练策略 (Section 3)


  • 数据集: 包含2005年至2023年10只重量级股票的历史日交易数据,特征包括开盘价、收盘价、交易量等。

- 特征工程:
- LSTM输入为序列的归一化收盘价,批量大小(11与21)调节时间依赖捕捉能力。
- GNN图由股票节点及基于相关系数和关联规则构建的加权边组成,覆盖线性及非线性关系。
  • 数据归一化: 采用Min-Max Scaling,将不同价格区间股票标准化处理保证模型收敛性。

- 图构建:
- 边权以 Pearson 相关系数阈值0.7 和 Apriori算法关联度阈值1.7为界。
- 图如图2所示,节点间边有效体现了股票复杂关联。
  • LSTM架构: 多层LSTM捕获复杂时间序列特征,Adam优化器及MSE损失函数,激活函数采用ReLU。

- GNN架构: 两层GCN实现邻居信息聚合,采用度归一化的消息传递机制,防止节点影响过度不均衡。
  • 混合策略: LSTM和GNN分别生成的特征向量拼接,通过密集层非线性转换实现隐含复杂关系建模,最终回归输出预测价格。


2.4 验证策略与超参数调优 (Section 3.6-3.7)


  • 扩展窗口验证: 训练数据逐步增加,测试集一天一天扩充,真实模拟市场数据动态更新,有效防止数据泄露。

- 超参数调优: 学习率(0.001~0.01)、批量大小、训练轮次(10~50)与提前终止机制综合调优,实现最佳训练效果。
  • 防过拟合措施: 使用dropout率为0.5,结合早停机制保证模型泛化能力。


2.5 实验结果分析 (Section 4)


  • 硬件环境: NVIDIA GTX 1080 GPU, 16GB内存及多核Intel i7,保证计算资源充足。

- 性能指标: 主指标为MSE,强调其对较大预测误差的敏感性,符合金融领域的风险防范需求。
  • 预测表现:

- 混合模型MSE平均为0.00144,较单独LSTM的0.00161降低约10.6%。
- 多次测试日均保持低MSE,偶有因剧烈市场波动(如2022年11月10日、30日)产生错误峰值。
  • 模型比较:

- 混合LSTM-GNN明显优于线性模型(MSE=0.00224)、CNN(0.00302)和DNN(0.00335),后者难以捕捉时间依赖或复杂股票关系。
- 热力图显示混合模型在10只个股上的表现均优于其他模型,特别是波动较大的CMCSA、AMD、INTC。

2.6 讨论与结论 (Section 5-6)


  • 结果解释: 模型成功集成时间序列和关系图信息,增强了对复杂金融市场因素的理解,提高预测精度和模型适应性。

- 局限性与挑战:
- 计算资源占用较大,适用性受限于实时高频交易场景。
- 扩展窗口训练导致训练频繁,提升了资源消耗。
- 超参数敏感,且数据依赖于历史模式,面对突发市场结构变化可能失效。
  • 实践意义: 有助于算法交易、风险管理和投资决策,更准确的预测降低金融风险。

- 未来方向: 融入宏观经济、新闻情感、社交媒体等多模态数据,提升解释性和模型实时性;推广至其他资产类别。

---

3. 图表深度解读



图1 - 标的股票价格及其50/200日移动平均线(第3页)




  • 描述: 展示10只标的股票自2005年至2023年的归一化收盘价及其50日和200日均线。

- 趋势解读: 大部分股票呈上涨趋势,移动平均线稳定反映中长期价格走势,短期波动通过50日均线体现。
  • 与文本联系: 突显市场长期增长背景下的时间序列特征,为LSTM的时间动态建模提供基础。


图2 - 股票关系网络图(第4页)




  • 描述: 节点代表股票,边表示通过相关系数+Apriori关联分析确定的强相关关系。

- 结构分析: 核心节点如MSFT、ADBE连接众多股票,表明其在市场中具有较强影响力和联动性。
  • 意义: 该图结构为GNN模型的输入,支撑关系建模的深层次因果分析,为网络聚合提供依据。


图3 - 扩展窗口训练示意图(第5页)




  • 描述: 依次扩展训练集,测试集滚动前进,保证训练数据总是历史时间序列的全集。

- 作用: 动态适应市场数据更新,防止未来数据泄露,使训练更符合实盘环境。

图4 - 不同测试日期的MSE变化走势(第6页)




  • 数据与趋势: 整体MSE均匀,证明模型稳定;特定日期MSE峰值反映市场剧烈波动对预测模型的挑战。

- 文本关联: 说明虽然模型表现优异,但极端事件依旧导致预测误差增加,提示进一步增强模型鲁棒性的重要性。

图5 - 不同模型MSE比较(第7页)




  • 数值说明: 混合模型MSE最低(0.00144),低于LSTM(0.00161)及线性(0.00224)、CNN(0.00302)、DNN(0.00335)。

- 关键结论: 表明结合时间与关系信息的混合方法具备显著优势,强化模型理解金融市场复杂性的能力。

图6 - 各模型在不同个股上的MSE热力图(第8页)




  • 细节观察: 混合模型在各个股票上的MSE均优于其他模型,尤其是CMCSA、AMD、INTC等波动股票表现明显。

- 模型稳定性: 该图揭示混合模型具备较强的泛化能力和行业横向适用性。

---

4. 估值分析



本报告为技术研究类预测模型研发报告,没有传统意义上的估值部分,未涉及现金流折现模型(DCF)或市盈率分析。关注点主要在模型性能(MSE)及其相对改进。采用的评估指标及其意图明确,契合金融市场实际需求。

---

5. 风险因素评估


  • 数据和模型的局限性: 数据噪声、异常值、缺失值对模型表现的影响,尽管原文数据经过预处理但市场特殊事件仍存在不可控风险。

- 模型过拟合风险: 扩展窗口训练有过拟合风险,且缺少独立验证集可能使模型对特定历史行情依赖较大。
  • 计算资源负担: 综合LSTM+GNN和不断扩充数据的高计算需求,限制模型在高频及资源受限场景的实用性。

- 市场结构变化: 假设历史模式依然有效,但结构性经济变化、黑天鹅事件会削弱模型预测能力。
  • 风险缓释措施: 模型设计了早停、dropout等机制降低过拟合,但对于市场突变,仍需进一步研究更加鲁棒的适应性策略。


---

6. 审慎视角与细微差别


  • 模型在实验设计上逻辑清晰,验证策略合理,结合时间和关系数据提供了创新视角。

- 超参数调优和训练策略详尽,但计算成本高昂,实际应用须权衡效率与效果。
  • 数据选择涵盖长期日期和多股票,但仍是有限的10只重点股票,行业覆盖及多样性有限。

- 扩展窗口策略虽创新但可能引入历史依赖偏差,缺少交叉验证可能隐含未来数据信息微泄漏风险的可能性。
  • 文本中对模型鲁棒性和解释性侧重较少,未来需要结合XAI技术对预测结果和模型机制进行深入解读,提升可信度。


---

7. 结论性综合



本文系统提出并验证了一种创新性的混合LSTM-GNN模型,将时间序列的动态捕捉与股票间复杂关联建模相结合,实现了对股价的更精准预测。通过详尽的数据预处理、关系图构建、模型设计与训练验证流程,该模型较传统LSTM及众多基线模型将MSE降低了约10.6%,增强了对市场复杂信号的理解能力。模型适应金融市场的非线性、多因素复杂依赖特征,表现出强稳定性和泛化能力,尤其在多个代表性大盘股应用中均取得优异表现。

多幅图表直观展现了数据趋势、模型构建逻辑、训练方法及性能优劣对比。图1证实时间序列特性的基本态势;图2至图3展示了股票关联网络及扩展窗口训练策略;图4至图6则多维度验证模型预测能力及优势。
尽管面临计算资源高、实时性弱、适用范围限制等挑战,该研究为未来集成多模态数据、提升解释力度及加速模型响应提供了坚实基础。报告提出该模型在实际交易决策、风险管理以及金融分析领域潜力巨大,也指出改进方向包括计算效率优化、多数据融合和模型解释性提升。

综上,该混合LSTM-GNN模型代表了股票预测领域的一次重要技术进步,充分融合了时间序列信息和股价关系网络,为复杂金融时间序列分析及预测提供了强有力的新方法论。

[page::0,1,2,3,4,5,6,7,8,9,10]

报告