`

GraphCNNPred: A Graph Neural Network Based CNN Model for Stock Market Index Trend Prediction

创建于 更新于

摘要

本报告提出了一种结合图神经网络(GNN)与卷积神经网络(CNN)的混合模型GraphCNNPred,用于基于多元特征数据预测美国主要股指的短期趋势。通过构建相关性图,对股市特征信息进行节点间消息传递,并结合卷积层提取时间序列特征,模型在S&P 500、NASDAQ、DJI、NYSE和RUSSEL五大指数上实现了较基线方法4%至15%的F-measure提升,交易策略模拟表现Sharpe比率超过3,展现了较强的预测和实盘应用潜力[page::0][page::2][page::4][page::6][page::8].

速读内容

  • 模型架构与方法[page::0][page::2][page::3][page::4]:

- GraphCNNPred结合了Graph Attention Network(GAT)或Graph Convolution Network(GCN)用于特征层间的相关性表示和消息传递。
- 卷积神经网络(CNN)主要用于时间序列的时长特征提取,设计灵感部分来源于经典的蜡烛图模式(如Three Line Strike)。
- 三种混合模型布局设计:GAT-CNN、CNN-GAT、CNN-GAT-CNN,灵活处理特征和时间维度。
  • 数据集与标签体系[page::3][page::4]:

- 使用2010年至2017年间多元股市和宏观数据,共138维特征,经过标准化处理。
- 设计两种标签体系,(0,1)二分类和(0,1,2)三分类,后者基于收益率的35%和65%分位数阈值,支持更细粒度的涨跌预测。
  • 模型性能表现[page::6][page::7]:

- F-measure最佳和均值表现统计:

| 算法 | S&P500 | DJI | NASDAQ | NYSE | RUSSEL |
|------------|--------|-------|--------|-------|--------|
| 2D-CNNpred | 0.5408 | 0.5562| 0.5521 | 0.5472| 0.5463 |
| 3D-CNNpred | 0.5532 | 0.5612| 0.5576 | 0.5592| 0.5787 |
| GAT | 0.5740 | 0.5495| 0.5523 | 0.5544| 0.5702 |
| GCN | 0.5310 | 0.5791| 0.5590 | 0.5405| 0.5574 |
| GAT-CNNpred| 0.5819 | 0.5861| 0.5775 | 0.5907| 0.5815 |
| GCN-CNNpred| 0.5866 | 0.5885| 0.5741 | 0.5767| 0.5954 |

- GraphCNNPred模型(GAT-CNNpred和GCN-CNNpred)显著优于传统CNNpred和纯图模型。
  • 交易策略及模拟结果[page::7][page::8][page::9]:

- 利用(0,1,2)标签进行多分类预测,结合交易信号产生做多、做空或空仓策略。
- 模拟交易中,GraphCNNPred获得较高的Sharpe比率和Certainty-Equivalent(CEQ)收益,表明稳定的风险调整收益能力。部分结果举例如下:

| 策略 | S&P500 | DJI | NASDAQ | NYSE | RUSSEL | 组合 |
|--------------|--------|-------|--------|-------|--------|--------|
| Always Long | 0.1056 | 0.1472| 0.1347 |0.0753 | 0.0739 | 0.1143 |
| 2D-CNNpred | 0.1422 | 0.1703| 0.1163 |0.1039 | 0.08039| 0.1302 |
| 3D-CNNpred | 0.1413 | 0.1344| 0.1642 |0.0830 | 0.0910 | 0.1458 |
| GAT | 0.1981 | 0.1980| 0.1742 |0.1597 | 0.1679 | 0.1822 |
| GCN | 0.1732 | 0.1801| 0.1794 |0.1345 | 0.1585 | 0.1684 |
| GAT-CNNpred | 0.2017 | 0.2191| 0.2301 |0.1882 | 0.1614 | 0.2116 |
| GCN-CNNpred | 0.1807 | 0.1805| 0.2258 |0.1848 | 0.1401 | 0.2123 |

- 与单纯持仓相比,GraphCNNPred改进了收益风险比,说明高效预测可正向推动交易策略表现。

深度阅读

金融深度学习研究报告详尽分析:《Graph-CNNpred模型及其股市指数趋势预测的应用研究》



---

一、元数据与概览(引言与报告概览)



报告标题:(论文无明确标题但可归纳为)“基于图神经网络和卷积神经网络的多数据源股市指数趋势预测模型——Graph-CNNpred”

作者:Yuhui Jin

机构:美国加州理工学院数学系(California Institute of Technology)

发布日期:2024年7月18日

研究主题:利用深度学习方法特别是图神经网络(GNN)结合卷积神经网络(CNN)技术,利用多样化数据源预测主要美国股市指数——标普500 (S&P 500),纳斯达克 (NASDAQ),道琼斯工业平均指数 (DJI),纽约证交所综合指数 (NYSE),拉塞尔2000 (RUSSEL) 的短期价格趋势。

核心论点与主要信息:
  • 提出了一种结合图神经网络和CNN的新型深度学习模型,称为Graph-CNNpred,用以从多维多源数据中提取表示,进而预测主要股票指数的短期涨跌趋势。

- 实验证明:Graph-CNNpred相较于基线模型(包括传统CNNpred及纯图模型),在所有五个指数上的预测F-measure提升4%-15%。
  • 通过基于预测结果的交易模拟,模型实现了夏普比率超过3,显著优于大盘始终做多的基线投资策略。

- 模型兼具多个创新性的结构设计,如引入基于相关性的图构造、图注意力机制以及灵活的CNN图层组合。
  • 论文结构包括相关工作回顾、数据集说明、模型细节、实验设计与结果讨论及交易策略模拟,最终总结展望未来研究方向。


---

二、逐节深度解读



2.1 介绍与背景(Abstract & Introduction)


  • 金融市场极为复杂,价格波动受全球经济、企业财务、新闻事件及市场情绪等多重因素影响。

- 经典的有效市场假说表明所有信息应即时反映在价格中。
  • 预测股价或指数趋势是金融领域持久的挑战,深度学习因其非线性建模能力而成为研究热点。

- 作者强调多样化数据集的必要性,涵盖了技术指标、宏观经济、世界股指、汇率、商品等82个特征变量。
  • 本研究通过结合图神经网络结构实现特征间的非线性依赖建模,从而提升预测能力。


2.2 相关工作综述(Section 2)


  • 介绍卷积神经网络(CNN)在时间序列股价预测中的应用,解释如何通过一维卷积滑动提取时间相关特征。

- 回顾类似U-CNNpred等工作,它通过分层预训练浅层CNN成功减少参数维度灾难。
  • 指出融合知识图谱(Industry Relations)的CNN模型(如KDTCN)用因果卷积避免未来信息泄露,提高突变价格的解释力。

- 介绍图神经网络(GNN)与RNN结合的方法,其核心在于根据股票间产业链和其他关联产生图结构,利用信息传递更新节点嵌入,提高个股和指数预测。
  • 说明LSTM-RGCN解决图卷积过平滑问题,通过历史数据推断关系矩阵,及多图卷积模型MG-Conv捕捉静态与动态指标相关性以预测指数趋势。


2.3 数据集(Section 3)


  • 数据源基于文献[9],共计82个每日特征,分为八类。

- 其中原始特征与技术指标在不同指数间差异较大,其他类诸如宏观经济、汇率等保持一致。
  • 特征涵盖从原始价格到衍生品价格、经济指标、美国大型企业数据以及期货合约。


2.4 方法论(Section 4)



4.4.1 CNN及CNNpred框架回顾


  • CNNpred利用1维卷积提取每日变量组合形成每日高阶特征,再通过多层卷积捕捉时间窗口中的趋势模式,最后使用全连接层输出预测。

- 输入为二维矩阵(天数 × 特征数),设计为通用模型,跨市场通用性强。

4.4.2 图神经网络(GNN)体系


  • GNN通过消息传递机制汇聚邻居节点特征,实现复杂图结构信息建模。

- 重点介绍两个经典GNN:图卷积网络(GCN)以固定权重函数聚合邻居特征,图注意力网络(GAT)通过注意力机制自适应计算邻居权重,避免人为指定权重并缓解过平滑。

4.4.3 本文提出的GraphCNNpred模型设计


  • 针对“每日特征提取”与“时间序列特征提取”两任务设计灵活的结构布局,包括CNN和图层的不同组合(GAT-CNN, CNN-GAT, CNN-GAT-CNN等)。

- 图的构造基于训练集特征间相关系数,设阈值0.7确定边存在,确保图结构反映统计相关性强的特征群体。
  • 图层主要采用GAT或GCN进行每日特征信息传播。

- 时序层采用卷积与最大池化组合,识别著名的蜡烛图技术中的短期趋势模式(如三线击破等)。
  • 预测层输出为5个指数次日上涨概率的多分类概率,用Sigmoid激活。预测可被二分类或三分类标签系统离散化,(0,1)和(0,1,2)标签分别对应负向、中性、正向涨跌。

- 引入多种图池化策略:均值池化、最大池化及带参数的全连接池化,依据任务表现选择最佳方案。

4.4.4 数据处理与标注


  • 标注基于未来收益的阈值划分,支持多日回报延伸(n=1至10日)。

- 采用训练集统计标准差均值做标准化,确保训练稳定性和收敛速度。
  • 数据切割为训练集65%、验证集15%、测试集20%,亦验证从2014年起的数据分割。


---

三、图表深度解读



图1:CNNpred架构示意图(page 2)


  • 描述:展示输入数据尺寸为60×82,即60天连续数据、82个特征。通过1×82卷积核提取每日综合特征,随后经过多层卷积、池化,再flatten进入全连接输出。

- 解读数据趋势:该图清晰体现每日特征提取与时间序列特征提取的顺序,1维卷积核随时间滑动提取特征,设计贴近金融时间序列分析需求。
  • 联系文本:支持方法论中描述CNNpred的框架和数据处理流程,牵引本文架构设计基础。


表1-4(第6-7页)各模型F-measure对比


  • 主旨:表1呈现六种策略在五个主要指数上的最佳F-measure,表2为其均值F-measure,表3和表4为2014年起的测试结果。

- 关键数据点
- GCN-CNNpred和GAT-CNNpred均明显优于2D/3D CNNpred及纯GAT、GCN模型。
- F-measure最佳提升幅度在大多指数达到了约5%-15%。
- 2014年测试数据下,Graph-CNNpred的性能优势依然显著,说明模型的鲁棒性和泛化性强。
  • 分析:融合图结构处理相关特征,结合CNN的时间提取能力,显著提升了预测的准确性,验证了论文提出的混合机制优越性。


表5-8(第8-9页)交易模拟指标Sharpe和CEQ比较


  • 描述

- Sharpe比率评估风险调整收益,值越高,表明策略越优。
- CEQ收益综合考虑平均收益和风险厌恶,定量表达实用盈利能力。
  • 数据亮点

- Graph-CNNpred模型在5个指数和组合交易中均表现优异,Sharpe均值超过0.2,远高于基准“始终做多”,后者全年Sharpe约0.1左右。
- CEQ收益同样明显优于传统策略,尤其是GAT-CNNpred最高达0.003535,显示稳定盈利空间。
  • 联系预测表现和最终潜在盈利:提升预测准确率能够转化为交易策略的收益改善,模型从理论到实证得到了验证。


---

四、估值分析



论文不涉及具体财务估值模型,而关注通过深度学习模型提升股市指数趋势预测的准确性和交易表现的量化方法。
  • 采用的目标评估指标为预测准确率(F-measure)和策略绩效指标(Sharpe比率、CEQ收益);

- 网络模型通过超参数调整(层数、通道数、池化方式)和数据标签设计后,实现优化;
  • 交易策略模拟则基于预测输出转化为多头、多空或观望信号,评估其风险调整收益表现。


---

五、风险因素评估



论文未显式列出风险因素,推断下列潜在风险:
  • 模型过拟合风险:多层图神经网络融入丰富参数,若训练样本划分不合理可能导致过拟合,影响泛化效果。

- 数据异常与非平稳性:金融市场本身极端波动和不确定性严重,历史相关性可能失效,影响图构造及信息传递准确性。
  • 模型复杂度与计算成本:结合图网络加深了模型复杂度,实际部署在实时交易系统时可能受限于计算资源。

- 标签定义的风险:采用门限定义涨跌样本标签,稍有偏差可能影响模型的训练效果,标签噪声可能降低性能。
  • 市场结构变化风险:多指数混合模型面对市场板块轮动、结构性变化可能反应滞后。


论文通过数据切分、标准化和多模型比较,间接缓解上述风险,但未详细讨论风险发生概率和直接缓解策略。

---

六、批判性视角与细微差别


  • 多模型结构的优势与挑战兼具:论文强调了图结构带来的相关特征信息汇聚优势,但未详细说明模型复杂度增加对于训练稳定性的潜在影响;尤其是GAT自注意力机制的参数量及训练难度未具体量化。

- 标签系统设计的创新与局限:引入(0,1,2)三分类标签,有助于区分显著不同幅度的收益变动,但是否会因类别不平衡导致某一类偏弱,比如“无明显变化”类别对模型预测的影响,未充分讨论。
  • 评估标准单一:虽然主要采用F-measure和交易模拟表现衡量,然而未结合更多实际金融风险指标(如最大回撤、胜率)进行全面评判。

- 图构造阈值选择的确定性:设定相关系数阈值0.7较为任意,是否有对阈值敏感度分析或动态调整机制,论文中未给出。
  • 数据时间范围及训练测试划分多样性:论文也对比了不同时间切分对结果的影响,体现了对时间非平稳性的考虑,是研究中的优点。


---

七、结论性综合



本文系统设计并实现了一套融合图神经网络和卷积神经网络的新型深度学习框架Graph-CNNpred,旨在基于多元异构金融数据预测美国五大重要股市指数的短期价格趋势。模型创新地利用特征间相关性构建图结构,实现了图层的消息传递以捕捉非线性依赖,并结合CNN擅长的时间序列特征提取能力,从而综合提升模型的表达力。

实验证明,该模型无论是在传统的预测准确率评价(F-measure),还是基于预测结果的交易策略绩效(Sharpe比率、CEQ收益)方面均显著优于之前的同类基线,包括经典的2D、3D CNNpred及纯图神经网络模型。5个指数均表现出明显提升,提升幅度在4%~15%之间,且交易模拟中经优化的图-CNN混合模型夏普比率超过3,盈利能力稳定且优于“始终做多”基准。

详尽的模型架构展示了图神经网络如何有效地提取每天特征间的结构信息,以及CNN如何捕获时间维度的动态变化,两者的有效结合突破了传统时序建模和独立特征处理的限制。多种布局方案、池化层设计、严格的数据预处理与标签体系,均保障了模型在金融复杂环境的适用性与表现。

整体而言,本文的Graph-CNNpred模型为金融时间序列及市场指数预测提供了一个创新且高效的框架,未来有望进一步应用于交易系统实盘策略中,并为金融智能分析开辟新的研究方向。[page::0,1,2,3,4,5,6,7,8,9]

---

附图示范:CNNpred模型架构示意



---

总结



此论文对股市指数趋势预测问题进行了全面而深入的研究,巧妙地将最新图神经网络技术与传统CNN特征抽取结合,清晰展现了模型构造、数据准备、实验验证、量化交易应用的全流程。数据驱动的图结构设计和灵活CNN层组合有效提升了预测精度和实用性,展现了未来金融智能分析领域值得借鉴的范式。

报告