`

Graph Signal Processing for Global Stock Market Realized Volatility Forecasting

创建于 更新于

摘要

本报告提出基于图信号处理(GSP)技术扩展HAR模型的全球股票市场实现波动率(RV)预测新框架。通过磁性拉普拉斯算子进行图傅里叶变换,实现对波动率溢出效应的时空及频谱域建模。采用可学习卷积滤波器捕捉中长期历史波动模式,实验基于24个全球股指的3500个交易日数据,结果显示新模型在短中长期RV预测上均优于HAR及图神经网络HAR等基准模型,且动态图设计(d-GSPHAR)进一步提升预测精度,证明了GSP技术在金融波动率建模中的有效性和扩展潜力 [page::0][page::7][page::14][page::19][page::21]。

速读内容

  • 研究背景及动机 [page::1][page::2]:

- 全球金融市场波动率预测关键,传统HAR模型无法捕捉资产间波动溢出效应。
- 现有VHAR、HAR-KS、GNNHAR等模型虽考虑溢出,但多视其为外生变量,缺乏频谱域深度分析。
  • Graph Signal Processing (GSP)与磁性拉普拉斯算子基础 [page::3][page::4][page::5]:

- 利用磁性拉普拉斯算子构建带方向性的归一化拉普拉斯矩阵,实现图的傅里叶变换(GFT)。
- GFT将股票市场波动率信号投射至频谱域,方便捕捉复杂波动传递机制。
  • GSPHAR模型结构与方法论 [page::6][page::7][page::8][page::9]:


- 根据Diebold-Yilmaz框架计算非对称波动溢出邻接矩阵,用q=0.25的磁性拉普拉斯处理方向性。
- 对过去22日的RV时间序列做GFT,实部与虚部分别利用具有可学习卷积权重的滤波器,区别处理中长期信息。
- 卷积滤波器权重大幅改善HAR中均匀权重假设,体现波动影响随时间平滑衰减。
- 逆变换回空间域,结合3层神经网络融合实虚部信息,输出最终预测。
  • 动态GSPHAR(d-GSPHAR)模型创新 [page::10]:

- 结合DY模型与滚动时段的Pearson相关系数对邻接矩阵加权,动态调整波动溢出网络,捕捉市场时变特征。
  • 实证结果与性能评估 [page::11][page::13][page::14][page::15][page::16][page::17][page::18][page::19][page::20][page::21]:

- 数据集涉及24个全球股指,3500交易日,分为70%训练样本和30%测试样本。
- GSPHAR在1天、5天、22天三个预测窗口的MAE均显著优于传统HAR、VHAR、HAR-KS、GNNHAR模型:

| 指数 | HAR MAE | VHAR MAE | HAR-KS MAE | GNNHAR MAE | GSPHAR MAE (最低) |
|--------|---------|----------|------------|------------|------------------|
| FCHI | 0.191 | 0.224 | 0.200 | 0.189 | 0.186 |
| AEX | 0.182 | 0.201 | 0.189 | 0.180 | 0.174 |
| … | … | … | … | … | … |

- MCS检验表明GSPHAR模型始终进入优胜模型集,且DM检验显示其预测显著优于比较模型。
- 卷积滤波器权重显示波动自回归中对最近滞后期给予更大权重,过程平滑衰减比传统HAR阶梯状更合理:

- d-GSPHAR在中长期预测进一步提升效果,反映动态波动溢出网络的价值。
  • 量化策略/因子总结 [page::7][page::8][page::19][page::20][page::21]:

- 设计基于磁性拉普拉斯的图傅里叶变换,结合可学习卷积滤波器动态调整权重,创新实现波动率溢出非均匀影响捕捉。
- 动态GSPHAR利用滚动Pearson相关矩阵调节邻接矩阵,实现随时间变化的波动溢出网络建模。
- 模型参数增长线性,适合处理大规模资产波动率预测任务。

深度阅读

Graph Signal Processing for Global Stock Market Realized Volatility Forecasting


作者及机构

  • 作者:Zhengyang Chi, Junbin Gao, Chao Wang

- 发布机构:悉尼大学商学院商业分析学科

报告主题


本报告聚焦于全球股市实现波动率(Realized Volatility, RV)预测,提出一种创新的基于图信号处理(Graph Signal Processing, GSP)技术与异质自回归(Heterogeneous Auto-Regressive, HAR)模型结合的框架——GSPHAR,用以更精准地刻画和预测多市场间波动率的溢出效应。

---

1. 元数据与概览



标题: Graph Signal Processing for Global Stock Market Realized Volatility Forecasting
核心贡献:
  • 提出首个将GSP技术融入HAR模型的综合框架(GSPHAR),以嵌入波动率溢出效应,而非仅作为外生变量。

- 引入基于图傅里叶变换的谱域分析,结合可学习权重的卷积滤波器,更细致捕捉历史中长期波动率模式。
  • 经3500交易日,24个全球主要股指实证验证,模型在短期、中期和长期内的RV预测均显著优于传统HAR及其多种扩展模型(如VHAR、HAR-KS、GNNHAR)。


主要信息传达:
建构更具有非线性、方向性和动态调整能力的多市场波动率预测模型,以增加风险管理和投资决策过程中的预测准确度,提高对全球金融市场波动传导机制的理解。

---

2. 逐节深度解读



2.1 引言与研究背景

  • 市场波动率的预测对于投资人、风险管理者和政策制定者极为重要。

- 波动率溢出效应描述市场间波动率冲击的传导,尤其在2008年金融危机和疫情背景下备受关注。
  • 实现波动率(RV)作为衡量高频数据波动的代表,被广泛采用,其计算为日内高频收益方差之和。

- HAR模型因简易和实用性被广泛采纳,但无法捕捉资产间波动率溢出。相关扩展如VHAR、HAR-KS、GNNHAR尝试加入溢出效应,但多以外生变量形式处理。
  • GSP推广信号处理到图结构数据,允许在谱域分析空间和时间之外的图结构特征,强化模型对波动率动态的表征。

- 本研究填补了GSP技术与HAR模型结合以全面嵌入波动率溢出效应的空白,提出GSPHAR框架:[page::0,1,2]

2.2 背景理论


图论基础

  • 图表示为$\mathcal{G}=(\nu,\mathcal{E})$,节点集合$\nu$与边集合$\mathcal{E}$。

- 邻接矩阵$\mathbf{A}\in \mathbb{R}^{N\times N}$反映图的连接状态,元素$\mathbf{A}{ij}$为边权重$w{ij}$(有向图时非对称)。
  • 度矩阵$\mathbf{D}$为对角矩阵,元素为节点出度之和。


磁拉普拉斯算子及GSP

  • 基于磁拉普拉斯(Magnetic Laplacian)$\mathbf{L}m^{(q)}$的定义,能同时处理有向图和无向图的图谱分析。

- 其中$q$为超参数调节方向感知,$q=0.25$时特别适合单边有向边的波动率传导网络。
  • 磁拉普拉斯本质上为复矩阵,其特征值为非负实数,特征向量为复数向量,允许图信号傅里叶变换(GFT)扩展到复数域。

- GFT及其逆变换提供图空间数据到谱域的映射,以分析并滤波图信号。[page::3,4,5]

HAR模型及波动率溢出扩展

  • HAR模型结合日、周、月三个时间尺度的RV数据,反映市场投资者的异质时间视角。

- 标准HAR模型预测表达式为:

$$
\widehat{\mathbf{v}}
{t}=\alpha+\betad \mathbf{v}{t-1} + \betaw \mathbf{v}{t-5:t-1}+\betam \mathbf{v}{t-22:t-1}
$$

其中$\mathbf{v}t$为各指数的开平方后RV。
  • HAR模型忽略资产间波动率相关性和溢出。

- GNNHAR通过引入图神经网络层串联HAR,利用固定邻接矩阵捕获邻域信息,实现非线性溢出效应建模,但需预先设定固定邻接矩阵,且模型中卷积权重统一,限制局部异质性表现。
  • VHAR和HAR-KS扩展考虑全部资产历史波动,但参数爆炸且简化为线性关系,性能受限。[page::5,6]


3. 方法学详解:GSPHAR 框架


3.1 基本模型架构

  • 输入包括24个股指的多变量RV时间序列和波动率溢出图的邻接矩阵$\mathbf{A}$,图构建采用Diebold-Yilmaz (DY) 框架计算出方向性波动率溢出矩阵作为邻接矩阵$\mathbf{A}^{DY}$,有效突出主导传输路径,克服传统对称方法无法捕捉方向性不足。

- 利用磁拉普拉斯计算归一化磁拉普拉斯矩阵$\widetilde{\mathbf{L}}
m^{(q)}$,设$q=0.25$适用于单边有向边。
  • 对21天历史RV序列通过图傅里叶变换$\mathbf{U}m^\dagger$投射至谱域,产生复数信号$\widetilde{\mathbf{v}}t = \widetilde{\mathbf{v}}t^r + i \widetilde{\mathbf{v}}t^i$,结合不同图频率上的波动率信息,融合空间及方向特征。

- 传统HAR模型对中长期采用均匀平均卷积核,假设各过去时间点影响力均等,忽视了影响递减动态。
  • GSPHAR引入可学习的凸权重卷积滤波器,针对中期(5天)和长期(22天)RV数据,逐Lag动态调整权重并分谱基应用,以更精细表达时间衰减和溢出影响。权重满足非负且和为1的约束,确保滤波器解释性。

- 利用HAR模型系数$\mathbf{W}$同权应用于实部和虚部的谱RV数据,计算未来谱端预测$\widetilde{\mathbf{v}}t^r , \widetilde{\mathbf{v}}t^i$。
  • 通过逆图傅里叶变换$\mathbf{U}m$恢复至空间域,得到复数预测向量$\overline{\mathbf{v}}t$,再通过三层神经网络融合实部与虚部信号,捕捉非线性耦合,输出最终RV预测。

- 模型参数随着资产数量线性增长,保证复杂系统可扩展性。[page::7,8,9]

3.2 动态建模:d-GSPHAR

  • 市场条件和投资者行为不断变化,导致波动率传导网络动态调整。

- 将DY计算的整体平均网络$\mathbf{A}^{DY}$和基于输入窗口的绝对Pearson相关矩阵$\mathbf{A}^P$结合,按不同时段(中期5天和长期22天)加权形成动态邻接矩阵$\mathbf{A}$。
  • 参数$\rho$权衡中期和长期相关性对整体网络构建的影响。

- 动态邻接矩阵反映时变市场关系,提高模型对变动交互的敏感度及预测准确率。[page::10]

4. 实证与评价


4.1 数据集与评测标准

  • 数据涵盖24个股指,超过3500个交易日(2002年5月至2022年6月),涵盖欧美亚多市场。

- 数据基于5分钟高频收益计算,实现RV后平方根放大100倍处理,保证时间序列平稳性(ADF检验均显著拒绝单位根)。
  • 70%数据用于训练,30%用于测试。

- 性能指标采用指数维度的平均绝对误差(MAE)测量预测精度。
  • 应用模型置信集(MCS)检验和Diebold-Mariano(DM)检验,统计验证预测准确性显著提升。

- 硬件及环境:Python 3.10 + PyTorch 1.13; Intel i9-13900HX + NVIDIA RTX 4080笔记本GPU。[page::11]

4.2 基准模型

  • 传统HAR、VHAR、HAR-KS及GNNHAR作为对比,GNNHAR中空间卷积层数调优后呈现最佳表现。

- 原文代码开源于https://github.com/MikeZChi/GSPHAR.git。[page::11,12]

4.3 实验结果详解


MAE比较(短期$h=1$,中期$h=5$,长期$h=22$)

  • GSPHAR模型在短期、中期、长期预测任务中分别在24,20和21个股指上表现最优,且在未获最佳时仍多为亚优,展示其预测准确性的稳定提升。

- 线性HAR模型表现明显落后,表明捕获复杂非线性溢出模式能力不足。
  • MCS检验结果显示GSPHAR在所有股指及预测期限下均入选显著最佳模型子集,表明其统计显著性和稳健性明显优于其他模型。

- DM检验进一步验证GSPHAR相较HAR、VHAR、HAR-KS、GNNHAR均显著提升预测准确度,尤其在多数股指上以5%显著水平拒绝了模型预测平等假设。
  • GSPHAR卷积权重较HAR的恒定权重表现出时间衰减的平滑连续性。图3显示GSPHAR对较近时间点(特别是$t-1$)赋予更大权重,后续滞后权重逐渐衰减,不同于HAR的硬分段平权,显示更贴合实际波动动态。

- 该权重动态表明HAR模型在中长期期权重分配中过度均匀化,忽视了时间依赖的层次递减特征。
  • d-GSPHAR进一步引入动态邻接矩阵调整体现时间波动性动态关联变化,较固定邻接矩阵模型在中长期预测MAE有一定改善,验证动态图结构对捕捉市场动态的价值。

- d-GSPHAR和GSPHAR短期性能相近,中长期d-GSPHAR更优,说明中长期波动网络动态变化更为显著。[page::13,14,15,16,17,18,19,20,21]

---

3. 图表深度解读



图1: GSPHAR模型架构图(page 7)


  • 描述:图示了模型五阶段流程

1. 基于波动率溢出图邻接矩阵$\mathbf{A}^{DY}$计算磁拉普拉斯及其谱分解$\mathbf{U}m,\boldsymbol{\Lambda}m$。
2. 利用$\mathbf{U}m^\dagger$将输入RV时间序列投影至谱域,得到实部和虚部复信号。
3. 对中长期周期分别使用可学习的卷积滤波器,加权聚合历史谱信号。
4. 用逆变换$\mathbf{U}
m$将滤波后谱信号重建到原始空间域。
5. 以三层神经网络整合实部和虚部信息,实现非线性融合输出预测。
  • 解读:该流程充分利用图结构的方向性和谱域特征,加权卷积滤波器替代HAR传统固定权重平均,结合神经网络处理复数空间增强模型非线性表达能力,理论与实践均促进预测准确性提升。


图2:24股指净波动率溢出图(page 12)


  • 描述:节点对应24市场指数,边权显示净双向波动率溢出影响程度,数字越大表明影响力越强,突出主要传递路径。

- 解读:该图体现多市场间复杂且方向不对称的波动率传导结构,是GSPHAR建模的基础输入,精准捕捉市场间动力学。
  • 该图支持作者强调使用DY框架提炼方向性邻接矩阵的合理性。


表1-3:不同模型不同时期MAE比较(pages 13-14)


  • 详细列出24个指数在短期、中期、长期内不同模型MAE。

- GSPHAR多数指数下最低误差,且显著性检验支撑这一结论。

表4-6:MCS测试结果(pages 15-16)


  • GSPHAR全覆盖所有指数入选5%显著水平下的模型信心集,显示其统计显著优越性。

- 其他模型频繁缺席,表明预测稳定性不足。

表7-9:DM测试结果(pages 17-19)


  • GSPHAR对比所有模型,绝大多数指数下在三时间窗口均达到显著优越。

- 尤其针对GNNHAR,DM检验结果显示GSPHAR更好捕捉了复杂溢出非线性和方向性关系。

图3:GSPHAR卷积权重与HAR权重对比(page 20)


  • GSPHAR权重明显以$t-1$为峰值,衰减平滑连续。

- HAR权重固定分段,缺少灵活性。
  • 权重的对比说明学习权重卷积滤波的优势,捕捉时序依赖的更细粒度动态。


表10:GSPHAR与d-GSPHAR MAE对比(page 21)


  • 短期表现近似,中长期d-GSPHAR微幅优于GSPHAR,证明动态调整波动网络的重要价值。


---

4. 估值分析



本研究主要为模型方法论与实证预测性能评测,未涉及对企业或资产估值的财务预测模型估值分析,因此无相关估值章节。评估重点为预测模型的统计性能与泛化能力。

---

5. 风险因素评估



文中未专门设风险因素章节,但隐含风险包括:
  • 邻接矩阵估计误差风险: DY框架基于历史样本估计波动率传导网络,若市场结构剧变,该邻接矩阵可能滞后失真。

- GSPHAR模型假设风险: 依赖图结构固定性及谱分解有效性,若图结构假设违背实际,模型性能受限。
  • 参数过拟合与动态调整不足: 尽管介绍d-GSPHAR动态邻接矩阵调优方法,但具体动态更新机制较简单,未来更复杂非线性动态的缺失可能导致模型适应性不足。

- 数据频率和覆盖风险: 高频数据波动及市场假期差异影响RV计算和模型训练稳定性。
报告建议未来研究关注动态波动率溢出图设计以应对市场结构变动风险。[page::22]

---

6. 批判性视角与细微差别


  • 创新性与适用性优势明显,尤其是引入谱域分析和可学习卷积滤波器,解决HAR预测中长期滞后权重固定问题。

- 模型强依赖DY邻接矩阵构建,若该基础数据或模型设定有误,可能导致传播路径估计不足,影响预测准确率。
  • d-GSPHAR动态邻接矩阵更新方案较为简洁,使用加权Pearson相关矩阵做调整,未来更精细、实时的动态网络构建方法待深入探究。

- 虽然相比GNNHAR,GSPHAR无需复杂图神经网络层,在可扩展性和稳定性上有优势,但在高度非线性复杂交互捕捉上是否有缺陷值得关注。
  • 实证研究仅覆盖24个指数,拟合于较为同步的市场,模型对异步或高频率非重叠市场适用性存疑。

- 表格数量大且全文聚焦预测精度,缺乏对模型内部机制(如卷积滤波器权重的经济解释)的深度挖掘。

---

7. 结论性综合



本报告提出的GSPHAR框架通过融合图信号处理技术与经典HAR模型,实现了对全球股市实现波动率的高精度预测。其核心创新在于:
  • 利用DY框架构造方向性波动率溢出图,嵌入磁拉普拉斯谱域滤波,实现波动率空间、时间与谱域的联合建模。

- 采用可学习的卷积滤波器替代传统的均匀平均策略,动态捕捉中长期时间依赖性,反映出更加复杂的时序衰减模式。
  • 结合浅层神经网络非线性整合复数谱域信息,增强模型表达力。

- 引入动态邻接矩阵(d-GSPHAR),初步捕获时变波动关系,进一步提升预测性能。

实证样本涵盖24个重要全球股市指数,长期全样本覆盖超20年,结果显示GSPHAR在短、中、长期预测中均显著优于传统HAR及其主流扩展(VHAR、HAR-KS、GNNHAR),预测MAE最小且统计显著,稳健性卓越。

此外,卷积滤波器学习权重揭示滞后权重呈平滑下降趋势,更符合金融市场实际,克服传统HAR模型的均匀加权局限。动态图机制体现了调整市场条件和投资者行为变化的潜力。

该研究不仅在金融市场RV预测领域创新了建模策略,也为未来结合图谱理论与时间序列分析提供了范例。未来方向聚焦于动态波动率传播图的设计与实时调整机制,进一步增强模型适应性和泛化能力。

---

参考图片



图1:GSPHAR模型架构


图2:24股指净波动率溢出图


图3:GSPHAR与HAR卷积卷积权重对比


---

以上分析详尽覆盖了报告的核心内容结构、关键方法、数据解读、图表内容及结论评估,且各结论均对应原文页码,确保内容的溯源和精准理解。[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22]

报告