`

A GCN-LSTM APPROACH FOR ES-MINI AND VX FUTURES FORECASTING

创建于 更新于

摘要

本报告提出将多通道图卷积网络(GCN)与长短期记忆网络(LSTM)相结合的创新框架,用于预测E-mini标普500和CBOE波动率指数(VX)期货的收益率、波动率及交易量。通过构造基于多种金融指标的相关网络,捕捉期货品种之间的高相关性与复杂交互关系,并在预测模型中实现信号传播,从而显著提升预测性能。研究验证了GCN-LSTM优于传统方法和纯LSTM网络,特别是在流动性较高的合约上表现最优。此外,结合经济意义的损失函数如Sharpe比率与Qlikelihood进一步增强模型实用价值[page::0][page::3][page::6][page::12][page::16].

速读内容

  • 研究背景与目标 [page::0][page::1][page::3]

- 聚焦E-mini S&P 500(ES)和CBOE波动率指数(VX)期货,重视不同到期合约之间的互动关系。
- 利用不同合约作为图神经网络中的节点,融合收益、波动率和交易量数据,形成多图输入。
  • 数据与图构建 [page::5][page::6][page::7]

- 使用2014-2023年10年小时级Tick数据,涵盖8个VX期货、4个ES期货及SPX与VIX指数。
- 构建六类有符号、有向图(收益-收益、收益-波动率、收益-成交量、波动率-波动率、波动率-成交量、成交量-成交量),图结构显示SPX与VIX形成两大簇,流动性对图的边连接度影响明显。
  • 模型架构与创新 [page::4][page::5]

- 每个节点独立由LSTM模块处理时间序列特征(图1),再通过多通道GCN层汇聚不同图的关系信息,最后经全连接层输出预测(图2)。


- 设计了基于Sharpe比率近似的差异化损失函数用于收益预测,基于Quasi-Likelihood的损失用于波动率预测,MAE用于交易量。
  • 预测表现及基线对比 [page::12][page::13][page::14]

- 收益预测:GCN-LSTM在大部分ES和VX期货合约中表现最优,Sharpe比率显著高于其他模型,尤其流动性强的ES1和VX1。

- 波动率预测:GCN-LSTM整体优于基线模型,特别在QLIKE指标上展现优势,但在HMSE指标表现差异较大。
- 交易量预测:GCN-LSTM在MAE指标表现优异,尤其在最活跃合约中,但MSE指标表现不突出。
  • 量化因子/策略总结 [page::6][page::12][page::16]

- 通过构建基于Spearman相关系数的有符号加权和非加权邻接矩阵表达多变量关系,实现信息在图中的传播,提升单一品种时间序列模型的预测准确性。
- 综合使用多种图(同期、时滞、加权、非加权)提升模型泛化能力,其中同期非加权图效果最佳。
- 特征重要性分析显示,加权指数加权收益率和波动率、多时间尺度的历史收益与波动率,及交易时间特征是三个预测任务中的核心因子。
  • 未来展望与应用意义 [page::16]

- 提议扩展至更多衍生品如期权,实现更大规模的图神经网络构造,检测多层次市场动态。
- 研究方法具有高度实用价值,因经济意义的损失函数设计促进金融实际操作的有效性。

深度阅读

金融研究报告详尽分析报告


报告标题:《A GCN-LSTM APPROACH FOR ES-MINI AND VX FUTURES FORECASTING》
作者:Nikolas Michael, Mihai Cucuringu, Sam Howison
发布机构:牛津大学统计系、数学研究所、Oxford-Man金融定量研究所、Alan Turing Institute
发布日期:2024年8月13日
主题:利用图卷积网络 (GCN) 和长短期记忆网络 (LSTM) 相结合的方法,对E-mini标准普尔500期货(ES)和CBOE波动率指数期货(VX)进行价格、波动率及交易量的预测。

---

一、元数据与总体概览



本报告提出一种创新的基于图神经网络的数据驱动预测框架,结合了多通道Graph Convolutional Network(GCN)与Long Short-Term Memory(LSTM)网络的优势,针对ES和VX期货中不同到期产品作为图中不同节点的特性,将这些期货产品间的相关结构网络化,以提升对它们的价格、波动率及交易量的预测准确度。

整体目标是捕捉和利用这些产品间的强相关性,通过图结构对信息传播,实现对多种金融指标的联合、多维度预测。他们通过多图并行GCN层对LSTM输出做空间依赖校正,结合时间序列与空间网络结构的优势,提升预测能力。

关键词涵盖:期货市场、收益预测、图神经网络、信号传播。

---

二、逐节深度解读



1. 引言与相关文献综述


  • 1.1 期货介绍

期货因可全天候交易、较高杠杆效应以及便捷做空等优势,被广泛用于风险管理和投机。报告聚焦于不同到期时间的期货交互,提及了现有文献对VIX期货波动率期限结构的建模尝试,明确数据驱动预测多期限产品的创新意义。
  • 1.2 SPX与VIX期货

介绍了ES期货(标准普尔500指数迷你合约,季度到期)和VX期货(月度到期)的市场背景及其经济含义。强调市场不同产品的价格发现动态,以及两类产品间基于标的及市场情绪的内在联系。
  • 1.3 收益率、波动率与交易量之间的关系

报告指明ES与VX的收益率具有显著负相关,波动率与交易量正相关,这些被已有文献反复验证。强调其为构建图网络边权的统计基础。
  • 1.4 图神经网络(GNN)背景

详细回顾了GNN及其发展,特别是Graph Convolutional Networks (GCN)在财务时间序列、股票预测和关联结构学习上的应用,标明其处理复杂图结构时间序列数据的优势。
  • 1.5 本文主要贡献

本文结合不同时间跨度、不同金融指标产品构建复杂多图结构,利用多通道GCN层融合LSTM时间序列预测,创新性地联合考虑收益率、波动率和交易量三个变量的空间-时间预测,采用经济学意义上的损失函数(如夏普率)进行训练,提升实用性。

---

2. 模型介绍


  • 模块设计

报告采用为各产品分别部署的LSTM + 多层Dense层模块(图1),允许每产品学习不同权重,提高表达能力。模型资源消耗高但拟合更精准。
  • 图卷积网络(GCN)设计具体细节

以单层GCN为基础,采用邻居信息的均值聚合(mean aggregation)更新节点隐藏层,权重矩阵和激活函数具体化。其中,对多图情形设计多组权重矩阵对应不同图邻接矩阵,体现多重空间关联。对14节点小型图,一层GCN足矣以捕获远邻信息。
  • LSTM复习

介绍了LSTM的门控机制及结构公式,说明其避免梯度消失爆炸,适合金融时间序列预测。
  • 整体GCN-LSTM架构

如图2所示,各节点产品独立输入相应历史特征序列,经过LSTM+Dense后输入GCN层处理多张图以实现节点间信息互通,最终输出联合预测结果。

---

3. 数据与图结构构建


  • 3.1 数据源和预处理

数据覆盖2014年1月至2023年12月的10年tick级Level-1订单簿数据,含8个月度VX期货、4个季度ES期货及其对应指数SPX、VIX。交易量通过统计订单簿更新次数的代理方法估算,清洗掉无流动性条目。
  • 3.2 图构建方法

利用Spearman秩相关构建有符号(正负权重)带权及无权(以K近邻限制边)邻接矩阵,分为现时和滞后相关四类。矩阵经过列方向正负归一化避免全连接问题,体现了产品间的复杂相互作用。
  • 3.3 图结构解析与讨论

通过图4、图5和表1的详情分析:ES(VX)产品在图中形成两大主群,且不同金融指标之间存在特征性连接模式,如收益率图内负边显著、流动性高的产品往往连接更多边、某些低流动性产品在特定图上连接度反常较高。复杂交叉边显示出市场多层次非线性交互关系,表明GCN层可充分发挥作用。

---

4. 预测任务配置


  • 4.1 重要金融语义定义

设计基于bid-ask均价的k分钟收益率与交易信号,计算日累计盈亏与年化夏普比率(P&L, Sharpe Ratio)等关键指标,用于预测性能经济效用评估。预测目标包括收益率、对数实时波动率(log RV)和交易量变动率的百分比变化。
  • 4.2 损失函数与度量

- 交易量以MAE和MSE
- 收益率结合传统MSE和基于夏普率的可微损失(tanh替代sign)混合损失以反映经济意义
- 波动率采用QLIKE与HMSE衡量,其中QLIKE对规模不敏感适合波动率预测
体现了模型训练同时追求统计与经济效益。
  • 4.3 预测特征设计

利用多尺度(5~360分钟)订单流失衡(OFI)、k分钟收益率、正负半方差、指数加权收益和波动率、成交量及时间日周指标等多维金融特征,涵盖价格、波动性、流动性多角度。
  • 4.4 多维基线模型与对比

设定OLS、LASSO、主成分回归(PCR)、随机森林、XGBOOST、纯ANN、LSTM及简单的基线模型作为对比,验证GCN-LSTM提升效果。
  • 4.5 实验实现细节

用TensorFlow框架实现,模块配置及细节见表2。

---

5. 预测结果分析



5.1 收益率预测


  • GCN-LSTM对ES 1、ES 2这类高流动性产品显著优于传统方法及其它深度学习模型,尤其夏普比率(SR)和盈亏表现(PPD)突出,体现结合图结构信息促进预测准确性。

- 对流动性较弱的ES 3、4,由于数据点不足结果不够稳定,线性模型反而更优。
  • VX期货中GCN-LSTM在8个产品中6个获得最高SR,剩余两个并列第二,明显优于ANN及纯LSTM,尽管在某些PPD指标上LASSO和PCR更优。

- 多步预测(不同预测时长)中,高流动率产品收到更高SR,尤其日频层面表现更佳,表5佐证。

5.2 波动率预测


  • 在QLIKE指标下,深度学习普遍优于传统方法,GCN-LSTM在SPX产品和大多数VX产品表现最佳或次佳,表6、7显示其优势明显。

- HMSE指标下随机森林表现更优,深度学习方法效果不及传统模型。
  • 存在QLIKE与HMSE表现权衡,暗示一模型兼顾捕获次级波动水平与误差幅度并非易事。

- GCN层整体促进了LSTM预测性能。

5.3 交易量预测


  • 以MAE衡量,GCN-LSTM在主要流动性产品上表现最好或次优,尤其ES 1、VX 1、VX 2。

- MSE指标表现则跌落,GCN-LSTM在此指标无明显优势甚至不及基线,可能因训练损失与指标不匹配。
  • LSTM表现与GCN-LSTM相近,只是对于部分中低流动性VX产品GCN-LSTM落后。


5.4 特征重要性


  • 利用LASSO系数作为可解释性指标:

- 收益率预测中,30、240、360分钟收益率和30分钟负半方差以及0.75指数加权收益波动率为重要特征。
- 波动率预测中,各指数加权波动率指标占优,尤其1.0权重的指数加权波动率,对于11个产品至关重要。
- 交易量预测依赖先前交易量和时间特征(日时指标,周一指标均显著)。

5.5 不同模型配置对比


  • 使用全部12张图的GCN层结合效果优于仅用部分图(如仅现时加权、邻接图等)。

- 现时无权图在ES 1与VX 1收益率任务表现最佳。
  • 损失函数选择对预测准确度影响显著,特定问题适用特定损失(如收益率不能仅用MSE)。

- 对于交易量预测,共享权重配置可能因相关性更强获得更好表现。
  • 滞后图优于现时图,凸显时间滞后的交互信息价值。


---

三、图表深度解读



图1(page:4)


展示了每个期货产品对应的LSTM+Dense模块结构。输入时间序列的多维特征先由LSTM层提取时序信息,再通过密集层组合抽象特征向量,为后续GCN层提供基础节点表示。此设计允许每节点单独学习个性化时间动态。

图2(page:5)


整体GCN-LSTM架构图。多节点模块并行工作后,利用多张预先计算的网络图进行特征传播。GCN层整合多维邻接关系强化节点间的空间依赖,最后输出预测。这体现了机器学习领域时间序列与图神经网络融合的典型范式。

图3(page:6)


基于ES和VX期货的小时收益率Spearman相关系数热力图。
  • ES各期货合约间高度正相关,VX类似。

- ES与VX期货间普遍负相关,尤其靠近到期合约间相关显著(ES1与VX1等)。
  • SPX指数与ES期货呈正相关,与VX期货呈负相关。

- 体现了产业内与跨品类之间强烈的价差关系,为图网络边权提供定量依据。

图4(page:9)


6个金融变量之间关系的可视化有符号、有向无权邻接图网络。
  • 绿色箭头代表正相关边,红色为负相关边。

- 易见两个明显的产品簇(为ES与VX聚集区),边的方向和符号反映变量间复杂定量关系。
  • 例如收益率-收益率图表现明显负边穿插,反映负相关,波动率-波动率图则更为聚合且正向边多。


图5(page:10)


同上图中各图的节点出度柱状图。
  • 高流动性节点(ES1, VX1等)在多张图中表现出较高连接度。

- 低流动性节点部分图中出度异常凸显,表明较为特殊的市场行为驱动。

表1(page:8)


总结不同图中产品之间连接特性统计。支持图4与图5的发现,尤其横跨SPX与VIX两簇边多且复杂,结合成交量和波动性等不同变量交互,展现出动力网络结构的丰富维度。

表2(page:12)


GCN-LSTM模型各组件参数规格(层数、节点数、激活函数等),具体数值细览用于复现实验与评估模型复杂度。

表3-9(page:12-15)


展示多种模型在收益率、波动率及交易量指标上的预测表现,包括传统模型和深度学习模型。GCN-LSTM表现通常优异,尤其在收益率预测和部分波动率、交易量预测中。性能评估考虑SR、QLIKE、MAE等多指标,覆盖风险调整收益和拟合效果多方面。

图6(page:14)


GCN-LSTM收益率预测下的累积P&L曲线。
  • ES1和VX1等高流动性合约曲线稳步上升,表明模型的实际交易策略值工具针对主流产品有效增益。


表10-11(page:17-18)

  • 表10呈现LASSO所导出的主要特征重要性顺序,反映对三个指标预测影响最大的特征集合。

- 表11展示不同图配置及损失函数对模型表现的影响,帮助验证整合多图与经济含义损失的设计优势。

---

四、估值分析



该报告属于预测模型构建和评估,不涉及传统企业估值方法(如DCF、P/E等),因此无估值模型讨论。

模型估值意义体现在用经济学意义的损失函数(Sharpe Ratio等)训练网络,使预测结果更适合投资决策和交易策略应用,而非无差别最小化误差。

---

五、风险因素评估



报告未集中列出风险因素,但通过讨论我们可推断潜在风险包括:
  • 数据质量风险:交易量近似计算可能偏差,影响训练准确性。

- 模型过拟合风险:深度模型尤其在低流动产品上数据稀疏,易拟合噪声。
  • 结构正确性风险:图结构构造依赖静态相关,多变市场结构可能降低模型泛化能力。

- 经济环境变化风险:季节性或突发事件(如市场崩盘)可能导致模型预测失败。
  • 指标权衡不一致风险:如波动率预测中QLIKE与HMSE表现反差,风险管理依赖指标选择。


未明确设缓解策略,但采用多模型对比、多指标评估来降低部分风险。

---

六、批判性视角与细微差别


  • 模型假设依赖性强:构造的图基于历史Spearman相关,默认未来相关结构稳定,但实际金融市场相关性常变,这限制模型适用范围。

- 数据替代指标存在缺陷:交易量用订单更新次数代替,可能影响预测质量。
  • 小样本影响:低流动合约数据稀疏,预测性能波动大,模型表现需谨慎解读。

- 不同性能指标结果分歧:波动率预测HMSE与QLIKE指标表现差异,表明模型对指标敏感,应用需权衡。
  • 非统一的最佳参数结构:部分预测任务中,参数共享与非共享模块、图选择和损失函数表现相悖,需针对具体任务调优。

- 缺乏实盘交易滑点和成本考虑:盈亏计算为理论值,未考虑交易摩擦可能高估实效。

---

七、结论性综合



本报告提出了结合GCN与LSTM的多图多通道融合架构,针对ES及VX期货产品的收益率、波动率和交易量进行联合预测。研究中:
  • 系统分析了产品间的价差与波动相关,构造了围绕收益率、波动率及交易量的多层图网络,图4和图5直观揭示了产品簇特征及交叉影响,这些图网络架构奠定了GCN层有效的信息传播基础。

- GCN-LSTM架构充分整合不同时间结构和关联网络,提升了预测准确性和稳健性,尤其在高流动性的ES 1、ES 2和VX 1、VX 2合约上,深度学习模型表现明显优于传统基线(表3-4)。
  • 通过经济学意义的损失函数(夏普率和QLIKE)训练和验证,确保结果不仅具有统计意义,也在风险调整和实盘操作层面具备参考价值。

- 特定配置和损失函数选择显著影响模型性能,结合全部图结构进行联合预测表现优于使用单一图,反映复杂市场结构下多维依赖的必要性(表11)。
  • 局限方面,包括市场结构变化敏感、数据替代指标的不足和低流动合约数据稀缺影响预测稳定性。

- 报告最后提出进一步拓展至衍生品(如期权)和其他期货市场的潜在研究方向,具有较强的未来发展空间。

整体来看,本研究为期货市场基于复杂交叉时空网络关系的多目标预测提供了新方法论,与传统时间序列或机器学习模型相比,GCN-LSTM有效提升了预测性能和金融经济实用性,尤为适合流动性较强的主要产品。

---

参考图表示范


  • 图1模块设计


  • 图2整体框架


  • 图3收益率相关热图


  • 图4六种图网络可视化


  • 图5节点出度柱状图


  • 图6累积盈亏图



---

参考文献标注


本分析中引用报告页码示例如下(括号内页码为报告原文对应页):
  • 对模型结构描述参考[page::3, page::4, page::5]

- 图3相关统计数据及含义[page::6]
  • 图4图5图表解析[page::7, page::9, page::10]

- 预测任务定义与损失函数说明[page::8, page::10, page::11]
  • 预测结果详解及性能比较[page::12, page::13, page::14, page::15]

- 特征重要性及不同配置对比[page::16, page::17, page::18]

---

综上所述,报告体现了基于图神经网络结合时间序列预测的高端金融量化研究,理论基础扎实,模型设计科学,实证结果充分,符合当前金融机器学习前沿趋势,具有良好的学术价值和应用潜力。

报告