Global Stock Market Volatility Forecasting Incorporating Dynamic Graphs and All Trading Days
创建于 更新于
摘要
本报告提出了一种整合动态图结构和所有活跃交易日的空间-时间图神经网络(DCRNN-RV)模型,用于全球股市波动率预测。通过动态计算波动率溢出指数构建时变邻接矩阵,模型有效捕获市场间非线性溢出效应及其时变关系,显著优于基准模型,且具备在非常规交易日进行多步预测的实用价值,强化了对全球金融市场波动动态的理解[page::0][page::1][page::6][page::10][page::16][page::33]。
速读内容
- 研究动机及背景[page::1][page::8][page::9]:
- 传统多变量波动率预测模型多限制于共同交易日,导致样本容量受限且实用性不足。
- 多数现有模型假设固定的波动率关系网络,忽略了市场间关系的动态变化。
- 波动率预测模型综述[page::3][page::4][page::5][page::6]:
- HAR-RV模型及其多变量扩展(VHAR-RV、HAR-RV-KS)具备不同程度的多市场波动率建模能力,但存在线性假设及过拟合问题。
- 基于图结构的GHAR模型引入关系图增强模型表达,GNNHAR模型通过多层图卷积捕获非线性和更广邻域溢出影响。
- Diffusion Convolutional Recurrent Neural Network (DCRNN)模型利用扩散卷积+GRU结构有效捕获空间-时间特征。
- DCRNN-RV模型设计亮点[page::10][page::11][page::12][page::14][page::16][page::17][page::18]:
- 构建动态时变邻接矩阵,利用Diebold-Yilmaz(DY)框架计算波动率溢出指数,去除不显著边缘保证稀疏性。
- 设计多重掩码矩阵处理不同市场非常规交易日的无交易数据,实现图结构信息传播的屏蔽,保证训练过程中的数据正确性。
- 模型采用序列到序列架构,用扩散卷积门控递归单元(DCGRU)实现多步预测。

- 实验数据与基线模型[page::21][page::22][page::23]:
- 数据包括八大代表性股票市场指数的5分钟粒度RV数据,时间跨度2006-2022年,共4079天(交易日并集)。
- 统计分析显示所有RV序列平稳,且分地区冲击期间波动聚集明显。
- 基线选择STG-Spillover模型(Son et al., 2023)作为对比,实验环境及代码开源。

- 实验结果与统计检验[page::23][page::24][page::25][page::26][page::27][page::28][page::29][page::30][page::31]:
- 各种历史窗口(100,250,500天)及预测步长(1,5,10,22天)下,DCRNN-RV模型MAE和MAFE显著优于基线。
- Diebold-Mariano(DM)检验和模型置信集(MCS)检验均确认DCRNN-RV在绝大多数市场显著优越。
- 在HIS、KS11、N225等易受影响市场上,模型性能稍弱,原因在于这些市场在多市场活跃日的缺席率较高,限制了图卷积的信息传播。
- 量化策略/模型创新点[page::10][page::14][page::16][page::18]:
- 利用DY波动率溢出网络实时动态更新图结构,摒弃传统静态图设计。
- 设计市场活跃状态掩码,确保图卷积传播过程中只考虑活跃市场节点,提高模型鲁棒性。
- 结合扩散卷积和GRU实现空间-时间联合建模及多步序列预测,提升预测精度与实用性。
- 实际意义与总结[page::33][page::34]:
- 模型支持在不同市场交易日不一致情况下的多步骤预测,具备显著的实际应用价值。
- 进一步强调了市场间波动率的共动性和溢出效应的双向性,推动多市场波动率分析的深入研究。
深度阅读
全球股票市场波动率预测模型报告详尽分析
---
1. 元数据与概览
- 标题:Global Stock Market Volatility Forecasting Incorporating Dynamic Graphs and All Trading Days
- 作者:Zhengyang Chi, Junbin Gao, Chao Wang
- 发布机构:悉尼大学商学院商业分析学科
- 发布日期:2024年10月2日
- 核心主题:全球股票市场波动率预测模型,结合动态图结构及交易日全集。
- 关键词:已实现波动率预测, 多元时间序列预测, 时空分析, 动态图神经网络。
该报告提出一种基于时空图神经网络(Spatial-Temporal GNN)的新型全球股票市场波动率预测模型——DCRNN-RV,创新地引入了“非公共交易日”(uncommon trading days,即各市场不重合交易日)的数据融合,以及动态变化的股票市场波动率传递(spillover)网络。报告核心论点在于,该模型能更准确地捕捉市场间波动率传递效应,从而显著提升多市场波动率的预测精度,并具有更强的实际应用价值。作者通过与当前基准模型STG-Spillover对比,系统验证了其预测性能的领先地位,特别是在不同交易日覆盖和动态关系网络条件下均表现优异,强调了波动率共动性和传递效应的重要性与双向性。最终,报告确认该模型在理论和实践层面均具备显著推进意义,尤其适合跨市场投资管理与风险控制应用。[page::0,1,33]
---
2. 逐节深度解读
2.1 摘要与引言
摘要部分明确提出,通过整合动态图结构和不同股票市场的所有活跃交易日,利用时空图神经网络捕捉波动率传递效应,DCRNN-RV模型整体优于传统基准,且对市场间波动率相互影响敏感。引言深刻阐述了波动率预测的重要性,突出波动率传递(spillover)作为全球多市场关联性的关键,梳理了该领域的前沿研究背景,强调了传统历史波动率指标被动态预测模型所替代的必要性。[page::1]
2.2 文献综述与波动率测度
- 波动率测度:报告选用由Andersen和Bollerslev提出的已实现波动率(Realized Volatility, RV),以高频数据(日内5分钟回报率)聚合而成,作为当天市场波动率的指标,充分利用高频数据提升波动率估计的细粒度和准确性。[page::3]
- 单变量模型:介绍HAR-RV模型(heterogeneous autoregressive model),将日、周、月三个时间尺度的历史已实现波动率作为输入,基于这些投资者不同持有期行为的区分来预测未来波动率。该模型虽具较好预测性能,但未涵盖市场间波动率的相互关系,不适合捕捉波动率溢出效应。[page::4]
- 多变量模型:
- VHAR-RV模型(向量HAR-RV)采用矩阵参数,显式建模市场间线性互依关系,参数规模迅速增长导致潜在过拟合问题。
- HAR-RV-KS模型包含邻近市场滞后波动率作为额外特征,虽提升交互信息捕捉,但仍限于线性关系与单时滞,结构单一且洪泛风险存在。
- GHAR模型利用Graphical LASSO(幸运消除法)的稀疏逆协方差矩阵构建静态邻接矩阵,加强模型效率,但仍局限于线性和局部关系。
- GNNHAR和STG-Spillover模型引入非线性多层图卷积及时序机制,拓展了关系捕捉范围和深度,显示出更优预测能力。特别是STG-Spillover利用DY框架(Diebold & Yilmaz的波动率溢出测量)替代了基于相关性的简单邻接构造,为模型提供更准确的动态传递结构。[page::4~7]
2.3 研究动机
当前多市场波动率预测模型存在两大局限:
- 交易日覆盖有限:依赖“共同交易日”样本,导致多市场样本量减少,数据利用率低且预测未来的“h步”实为“h个共同交易日”,忽略了各市场差异化活跃交易日。投资者在跨市场不同行情期间需要准确的非常规交易日波动率预测。
2. 传递关系图静态固定:多数模型采用固定邻接矩阵,忽视波动率传递动态变化的现实。政治、经济、危机及市场发展等多因素驱动的动态波动模式未被有效捕获,限制模型表现。
该报告旨在解决这两点,利用DCRNN结合非公共交易日数据掩码和依赖DY框架动态更新的波动率网络构建,实现对全样本数据和时变传递结构的综合建模,提升多市场波动率预测的实用性和准确性。[page::8,9]
2.4 方法论与模型实现
- 图神经网络基础:基本定义图$\mathcal{G}=(\nu, \mathcal{E})$,节点、边及其特征矩阵,邻接矩阵及度矩阵的构造和意义。通过信息传播机制和邻居聚合函数,实现节点特征的高阶聚合变换。[page::10,11]
- 非公共交易日处理机制:引入掩码矩阵$\mathbf{E}^X$和$\mathbf{E}^Y$标识输入输出矩阵中活跃/非活跃市场的数据空缺,避免无意义的零值影响训练和标准化后的数值混淆;对损失函数MAE中特别计算生效掩码以控制训练反馈。引入时刻$t$动态邻接掩码$\mathbf{E}^{At}$,将非活跃节点相关连接置零,确保激活市场间传播机制的准确性和有效隔离非活跃市场干扰。[page::11~13]
- 动态图结构构建:利用DY框架基于VAR模型的方差分解,形成波动率传递矩阵$\tilde{\theta}^g(H)$,作为动态邻接矩阵;每个训练批次计算对应的动态图,相比传统固定结构保留更多传递信息和动态适应性,通过设定稀疏比例减少冗余边,兼顾信息保留和参数效率。强调输入数据时间长度$TX$足够长以保证DY方法数值稳定与长期记忆特性捕捉,显著区别于HAR中时间窗短暂的设计。[page::14~16]
- DCRNN-RV模型核心实现:
- 使用图扩散卷积捕捉节点间的随机游走传播过程;
- 基于图卷积的门控循环单元(DCGRU)结合时间序列推进机制,捕获波动率的空间依赖和时间动态;
- 采用编码器-解码器结构(Seq2Seq)完成多步预测,支持跨时间窗口多尺度输出。
- 结合非公共交易日掩码与动态邻接策略,创新性允许模型处理真实市场全部交易日,实现覆盖非公共交易日的波动率预测,提升实际操作的可用性和灵活性。
- 图1示意该模型的编码-解码流程。

2.5 实验设计与结果分析
- 数据集:利用包括8个全球主要股票市场指数(SPX, GDAXI, FCHI, FTSE, OMXSPI, N225, KS11, HSI)的5分钟高频已实现波动率,涵盖2006年10月至2022年6月共4079个交易日,采用其平方根处理确保数据平稳性(ADF测试显著拒绝单位根),保障模型训练稳定性。[page::21,22]
- 基线模型:以Son等人(2023)提出的STG-Spillover模型为对照。为实验公平,双方均沿用相同DCRNN初始架构和超参数。
- 评价指标:
- MAE:直接预测误差,反映模型在给定历史窗口下的瞬时预测精度。
- MAFE:迭代预测误差,通过模型自生序列预测检验长期稳定性和误差积累。
- DM检验:评价两模型预测误差序列差异的统计显著性。
- MCS检验:识别统计上表现无明显落后于其他模型的候选最佳模型组。
- 多个历史窗口(6、12、24个月)以及未来多步预测窗口(1,5,10,22)被测试,确保结果的全面覆盖。[page::19,20,23~31]
- 实验核心结果:
- 直接预测MAE (见表3-5):DCRNN-RV在所有时间尺度下均优于STG-Spillover,数值上误差降低幅度明显,且趋势随历史窗口长度增加而持续保持优势。
- 迭代预测MAFE (见表6-8):力度更强,DCRNN-RV对7个(或以上)市场指标在不同窗口组合均表现更佳,尤其是SPX、FCHI、FTSE、OMXSPI等市场。
- DM统计显著性测试 (见表9-11):多数市场在多数窗口配置下,DCRNN-RV预测显著优于STG-Spillover,尤其是在SPX、FCHI、FTSE等有代表性的市场,显著性均保持在5%水平以下。
- MCS模型组测试 (见表12-14):DCRNN-RV几乎持续进入最佳模型集合,表现稳定超越对照模型。
- 例外分析:HSI、KS11、N225等被定义为“受影响市场”(impressionable),在DM和MCS测试中表现提升空间有限;通过统计$\omega$指标反映这些市场在交易日活跃度低于其他市场,导致其接收波动溢出机会较少,限制了图神经网络的传播效果。[page::31~33]
---
3. 图表深度解读
表1(第22页)- 八大指数的平方根RV描述性统计
- 为每个指数统计均值、标准差、偏度、峰度及单位根检验ADF统计量和p值。结果显示所有序列均显著平稳(p<0.05),且普遍存在较高偏度和峰度,说明波动率分布偏态显著、胖尾特性明显,支持对数据进行平方根变换和复杂模型捕捉非线性行为。
图2(第22页)- 八大指数估计波动率时间序列可视化
- 横跨2006-2022年区间,显著标示全球金融危机(灰色)、欧债危机(黄色)和新冠疫情(红色)三个期间。图示清晰展示各指数波动率在重大事件时段的峰值显著上升,验证了波动率具有聚类性和周期波动特点,也强调模型需捕获市场间事件驱动的动态交互。
表2(第23页)- DY框架测算的市场净波动传递效应
- 显示各市场的净波动溢出值,正值市场如SPX,FCHI,FTSE和GDAXI是波动率主要传递者,负值市场如HSI、OMXSPI、KS11和N225则更被动接受外部传递的波动冲击。此划分对理解市场影响力结构及模型中图传播通路设计至关重要。
表3-5(第23-24页)- 不同窗口下DCRNN-RV与STG-Spillover模型直接预测MAE对比
- 结果均显示DCRNN-RV在所有预测步长和历史窗口长度上均取得更低误差,特别是1日和5日报告期表现突出,MAE值相较提升至10%以上,体现其模型架构对于短期预测的优势。
表6-8(第25-26页)- 迭代预测下MAFE详细分市场对比
- 细分各指数表现,DCRNN-RV在大多数市场中均优于对照模型,且整体表现与窗口参数关系不大,反映其强泛化能力。值得注意的是HSI、KS11与N225呈现较小优势甚至劣势现象,结合$\omega$指标分析进一步说明其成交天数稀疏限制了图卷积效果。
表9-11(第27-29页)- DM统计显著性检验结果
- 在6、12和24个月的历史窗口内,DCRNN-RV在至少超过半数市场和大部分预测步长下差异均显著(p值远低于0.05)。SPX、FCHI、FTSE等核心市场预测优势极为明显。反复说明该模型稳健提升了预测准确度。
表12-14(第30-31页)- MCS测试,模型表现更进一步验证
- DCRNN-RV模型几乎一直处于最优模型集合中,而STG-Spillover在大多数组合中未能进入。统计方法的严格性保证了 DCRNN-RV 改进非偶然性和广泛有效性。
表15(第32页)- $\omega$指标,即不活跃市场占比统计
- 体现关键影响因素,表明HSI、KS11、N225市场因非活跃日比例较高,在波动率传递链条中的参与度受限,导致模型预测效果相对减弱。反映非公共交易日处理策略虽为创新,但该因素依然影响市场表现差异。
---
4. 估值分析
本报告并未涉及公司估值内容,无需估值模型剖析。
---
5. 风险因素评估
报告未专门支出章节讨论风险因素及对应风险缓释策略。结合研究内容可理解:
- 数据完整性和质量风险:非公共交易日处理依赖掩码和缺失值填充,可能引入不确定性;及时准确的假期信息极为关键。
- 图结构构造风险:DY框架算估计依赖较长时间窗,相对昂贵的计算成本和参数调优需求。
- 内生性和外生性冲击风险:全球政策、突发事件等动态因素对波动传递关系的突变未必能被模型完全捕获。
- 模型过拟合风险:多层深度图神经网络存在潜在过拟合,尤其在参数规模与数据样本不匹配时。
报告中虽未详述,但设计多种掩码、动态图排除静态误差已体现一定风险控制意识。
---
6. 审慎视角与细微差别
- 模型优势与弹性:
报告强调DCRNN-RV模型可通过动态调整波动率关系图以及全交易日数据,彰显极大灵活性和信息利用效率,显著优化多市场预测性能。
- 潜在局限:
非公共交易日的掩码机制依赖数据质量和外部约定,若市场突然政策变动或异常停牌,模型应变能力待考察。
DY框架基于线性VAR模型,可能无法完全覆盖波动率传递的非线性复杂性,尽管引入图神经网络试图弥补此缺陷。
印象易受影响股市如HSI、KS11的表现不及主导市场显示模型对数据活跃度敏感,提示预测的公平性和普适性仍有提升空间。
- 数据及方法说明的完整性:
报告附带开源代码和明确数据来源,保证了研究可复制性和学术透明度。
---
7. 结论性综合
本研究基于DCRNN框架,提出了创新的动态图神经网络多市场波动率预测模型——DCRNN-RV,核心贡献在于打破传统模型对“共同交易日”依赖,成功融合了各市场所有“非常规交易日”的数据,结合DY框架动态估计波动率传递矩阵,构建时间变异的邻接图结构,实现了对全球主要股票市场波动率传递机制的灵活捕捉与预测强化。
实证结果严密且多维度验证了DCRNN-RV模型相较于现有同基线STG-Spillover模型的显著优势:无论是直接预测误差还是迭代预测误差,都在绝大多数市场与时间窗口下取得更低误差,且这种优势具统计显著性支撑。
特别值得强调的是,对于活跃影响力市场如SPX、FCHI、FTSE等,模型表现优异;对非活跃易受影响市场的性能不足被客观地归因于交易日缺失比例,反映了其高度依赖图神经网络传播机制的前提条件。
从图表分析角度,报告详细揭示了各市场波动率时间变化特征及波动率溢出效应的复杂结构,为理解全球股市的互联性与传播路径提供了全新视角。
模型在实际金融场景,特别是跨市场投资组合风险管理与资产定价方面,具有立竿见影的实用意义,为研究群体和实务界开启了新兴的工具箱和方法论框架。
综上,报告成功推进了多市场波动率预测研究的边界,兼具理论深度与实务应用价值,建议未来研究重点关注非活跃市场数据稀疏对模型机制的影响、突发事件下动态图结构的快速更新机制以及跨市场非线性关系的深入建模。[page::33]
---
总结
该报告提供了金融时间序列波动率预测领域最前沿的技术创新,即结合动态图神经网络和交易日全覆盖,破解传统多市场模型的硬限制,提升预测精度及广泛的应用可能性。其方法论和实证研究均严谨扎实,结果充满说服力,是金融量化风险管理及市场分析方向的重要贡献。
---
以上分析涵盖报告全部重要章节与图表,精准解读了报告论点、数据及技术细节,可满足深度专业研究与应用需求。