`

From GARCH to Neural Network for Volatility Forecast

创建于 更新于

摘要

本报告首次建立了经典GARCH族模型与神经网络(NN)模型的等价关系,基于此提出GARCH-NN方法,将GARCH的波动率统计特性(风格化事实)无缝注入NN框架,显著提升了波动率预测的精度和解释性。通过将GARCH模型的NN对应结构嵌入LSTM,提出GARCH-LSTM模型,实验证明其在多个资产时间序列上的表现优于单独的统计模型或深度学习模型[page::0][page::1][page::2][page::6]。

速读内容

  • 等价关系及方法创新 [page::0][page::1][page::2]

- 首次研究并证明了GARCH族模型(如GARCH(1,1)、GJR-GARCH、FI-GARCH)与对应的神经网络结构(如RNN、CNN)之间的严格等价性。
- 通过保持相同的输入、参数、结构和最大似然损失函数,实现两个模型训练过程及输出一致。

- 提出GARCH-NN框架,将GARCH家族模型的NN对应体作为模块嵌入LSTM,融合统计模型的波动率特性与LSTM的长短期记忆能力,形成可解释且性能优越的混合模型。
  • 数据集与实验设置 [page::3][page::4]

- 选取五种全球广泛交易资产:S&P 500、DJI、NASDAQ、欧元兑美元、黄金,时间序列长度均约2500+,均通过ADF与KPSS检验保证数据平稳性。
| Dataset | Length | Mean | Sd | ADF | P-value |
|---------|--------|-------|-------|--------|-----------|
| S&P500 | 2514 | 0.0414| 1.078 | -15.99 | 6.72e-29 |
| DJI | 2515 | 0.0314| 1.93 | -15.93 | 7.76e-29 |
| NASDAQ | 2516 | 0.0574| 1.261 | -13.66 | 1.56e-25 |
| EUR-USD | 2603 | -0.0109|0.497 | -22.08 | 0.0 |
| Gold | 2514 | -0.0012|0.984 | -51.95 | 0.0 |
  • 等价关系验证 [page::4][page::5]

- 使用模拟数据验证GARCH与其NN对应模型的参数估计非常接近,表明两类模型在参数层面等价。
- 实际数据预测结果显示GARCH模型及其NN对应版本在MAE和MSE指标上表现相近,支持其等价性。
| Method | Parameter | GARCH | NN Counterparts |
|----------|-----------|------------------|--------------------|
| GARCH(1,1)| ω | 0.00359(0.00659) | 0.00429(0.00659) |
| | α | 0.00923(0.0131) | 0.0116(0.0161) |
| GJR-GARCH| Parameters| 0.00068~0.00451 | 0.00081~0.00415 |
| FI-GARCH | Parameters| 0.0185~0.164 | 0.0249~0.0827 |
  • 损失函数及模型表现 [page::4][page::5]

- 引入基于最大似然的N-loss和T-loss,显著优于传统MSE损失,T-loss(v=5)效果最佳,因其更符合波动率统计特性。
- GARCH-LSTM模型在多时间尺度(日、周、月)和多资产上均超越经典统计模型(GARCH、GJR-GARCH、FI-GARCH)及多款Transformer-based深度学习模型(Autoformer、Informer等),在MAE和MSE上通常提升约3%和10%。

  • 量化模型(GARCH-LSTM)核心设计 [page::2][page::3]

- GARCH对应的RNN和CNN结构作为模块灵活插入LSTM网络。
- 模型输出为GARCH输出乘以带权双曲正切的LSTM记忆控制,权重调节模型对LSTM记忆的依赖强弱。
- 输入调整为前一时点残差,避免了传统RNN直接输入当前残差的不确定性。
  • VaR风险管理应用验证 [page::5][page::6]

- 使用五种资产的实际交易数据,通过GARCH-LSTM计算VaR,记录超出VaR界限的违规率。
- GARCH-LSTM的违规率较GJR-GARCH明显降低,整体符合5%置信水平,展现了其风控实用性。

深度阅读

金融研究报告详尽分析报告


报告标题与元数据

  • 标题: From GARCH to Neural Network for Volatility Forecast

- 作者: Pengfei Zhao, Haoren Zhu, Wilfred Siu Hung NG, Dik Lun Lee
  • 机构: 广东省跨学科数据科学联合实验室(广东省重点实验室),香港中文大学(深圳)-香港浸会大学联合国际学院,香港科技大学

- 通讯邮箱: ericpfzhao@uic.edu.cn 等
  • 日期: 报告未明确给出具体日期,但参考文献最新为2023年,推测为2023年或2024年初发布

- 主题: 探索金融波动率的建模与预测,建立经典随机波动模型GARCH与神经网络(NN)模型的等价关系,提出结合GARCH家族特性的神经网络波动率预测模型——GARCH-NN,特别是GARCH-LSTM模型,提升波动率预测的准确率和模型解释性。

---

1. 报告概览与核心论点


本报告聚焦于金融市场波动率预测这一风险管理的核心任务,指出传统的经济计量学方法(以GARCH家族模型为代表的随机模型)和机器学习方法(尤其是神经网络)各自优劣显著,且学术界长期以来呈现割裂状态。作者创新性地提出通过建立GARCH模型与对应神经网络结构的等价关系,将GARCH模型的“波动率风格特征”(Stylized Facts,SFs)内嵌进神经网络框架,进而构造新型的GARCH-NN模型体系。以GARCH-LSTM为代表的混合模型不仅提升了预测精度,同时增强了模型的可解释性,并在多个全球标普指数及货币黄金等数据集上均取得优异性能。作者声称这是首次有效桥接随机模型与深度学习模型的研究。[page::0,page::1]

---

2. 内容结构逐章解析




2.1 引言

  • 波动率的定义与重要性: 波动率衡量资产收益率的不确定性,帮助投资者评估风险和预期回报,关键用于风险计量(如VaR模型)。

- 现有预测方法分类: 随机模型(例如GARCH系列)理论基础扎实、解释性强,但依赖许多静态假设,不适应复杂非线性金融市场;神经网络类机器学习模型计算能力强,能够逼近非线性函数,但表现不稳定,解释性差,面临过拟合与非平稳数据挑战。
  • 两路技术发展割裂现象: 传统经济计量学方法和深度学习研究路径未有效融合。

- 波动率的“风格特征”: 波动率存在持久性(波动率聚类)、负面行情下更剧烈的波动(非对称性)、和长记忆效应等行为特征,传统GARCH模型捕捉并利用了这些事实,提升预测能力。
  • 研究动机: 融合GARCH的金融领域知识(SFs)和神经网络的强大建模能力,以克服各自缺陷,实现更优波动率预测和模型解释性提升。[page::0]


2.2 现有相关工作

  • 介绍了三类主流GARCH模型:经典GARCH(1,1)(短期记忆,广泛实用),GJR-GARCH(解决波动非对称性),FI-GARCH(引入长记忆特征)。

- 神经网络模型方面,指出Transformer及其变种对时间序列预测取得进展,但在波动率预测中未必优于经典GARCH模型,原因在于网络结构未针对波动率的SFs设计。
  • 现有部分混合方法仅简单地将GARCH参数或输出作为神经网络输入,无法真正融合两者模型结构及内涵。相比而言,本报告提出的GARCH-NN端到端框架,将GARCH模型以神经网络“内核”形式嵌入,提升训练效率及解释力。

- 论文采用的神经网络模型选型较为基础,有利于深入理解和构建GARCH与NN的数学等价性。[page::1]

2.3 理论预备与问题定义

  • GARCH(1,1)基础公式明确给出,波动率由过去残差平方项和自身历史平方估计项线性组合构成,具有短期指数衰减记忆特性。

- 预测任务定义:基于历史残差平方序列,预测未来h步的条件波动率。
  • 模型设计目标:构造高度可解释且具备明确统计意义的神经网络模型,或有等价经济计量表示的模型。

- 核心方法论步骤:
1. 建立GARCH模型与神经网络(主要是RNN类型)在结构和参数层的等价关系。
2. 将神经网络形式下的GARCH模块集成进更复杂的NN架构(如LSTM),同时保持GARCH捕捉的波动率SFs。
  • 等价关系详解:

- GARCH(1,1)模型形态递推结构与简化的RNN单元等价(除去激活层与输出层)。
- GJR-GARCH纳入符号信息,输入变为残差带符号的平方因子,RNN输入对应调整。
- FI-GARCH长记忆模型对应1D CNN,系数序列相当于卷积核权重对残差平方序列做滑动卷积。
  • 图示说明(图1):

- (a) 基本RNN结构
- (b) GARCH(1,1)递归结构与RNN对比
- (c) GJR-GARCH对应RNN结构
- (d) FI-GARCH对应卷积网络结构
  • 损失函数选择:采用基于最大似然估计的负对数似然损失(N-loss和T-loss),保持与随机模型目标一致,增强相容性与解释力。

- GARCH-LSTM模型设计:
- 将GARCH核函数定义为LSTM的输出门,利用LSTM细胞状态控制长短期记忆维度对波动率影响的调整,呈现端对端融合结构。
- 模型的灵活设计允许替换不同GARCH核,且通过权重参数调控LSTM对输出影响强度。
[page::2,page::3]

2.4 实验设计与验证

  • 数据集说明:五类不同资产(S&P500, DJI, NASDAQ, EUR-USD汇率, 黄金),数据长度2500余条,均检测序列稳定性(ADF和KPSS测试均支持平稳)。

- 训练集、验证集、测试集划分比例约为8:1:1。
  • 实验指标:均方误差(MSE)和平均绝对误差(MAE)。

- GARCH-NN等价验证:
- 利用模拟数据(模拟参数在(0.1,0.9)范围)训练GARCH与NN模型,对比估计参数,结果表明两类模型参数估计准确度相近,表明建立的等价关系有效。
- 在真实数据上对比两类模型的预测性能,结果显示性能相近。
- 优化算法方面,虽然理想状态保持相同优化器(SLSQP),实际NN采用了Adam + 学习率动态调整、早停机制等,更适合网络训练环境,依然验证了模型等价的实用性。
  • 不同损失函数对模型性能影响:

- 对比MSE、N-loss、T-loss(自由度v=3和5),发现以最大似然为基础的N-loss和T-loss显著提升了预测性能,尤其T-loss(v=5)效果最佳,故后续模型训练均采用该损失。
  • 综合模型性能评测:

- 对比GARCH-LSTM与4种基于Transformer的深度学习方法(Autoformer, Informer, Reformer, Transformer)及经典的GARCH家族模型,涵盖多个预测预测时间窗口(1天至1个月)。
- 结果显示GARCH-LSTM在绝大多数数据集和预测期限表现优于深度Transformer模型及传统GARCH模型,平均在MAE和MSE方面实现3%和10%左右的提升。
- Transformer类方法在长期预测表现不佳,与现有文献(Zeng et al. 2022)观点一致。
- GARCH模型依然保持稳定表现,但其受到输入序列长度与记忆机制限制。
- GARCH-LSTM表现出更好的稳定性和鲁棒性,误差波动较小(约1e-4)相比深度学习方法(约1e-3)。
  • VaR风险管理应用案例分析:

- 以NASDAQ数据进行1天5%置信水平的VaR计算和违约率监控。
- 三种模型(GARCH(1,1)、GJR-GARCH、GARCH-LSTM)总违约率均约5%,验证了模型波动率预测的有效性。
- GARCH-LSTM通常具有较低的上下违约率,显示其风险计量的优势。
- 实验表明波动率预测的准确性直接影响VaR性能,反之亦然,二者需结合综合评价。
- 图2清晰展示了实际收益与模型计算的上下VaR边界及违约次数,为模型应用场景提供了直观感受。
[page::3,page::4,page::5,page::6]

---

3. 图表深度解读



3.1 图1——GARCH模型与神经网络模型结构的等价示意

  • (a) RNN结构展示序列输入$x{t-1}$与隐藏状态$h{t-1}$推导输出$yt$及更新下一个隐藏状态$ht$。

- (b) GARCH(1,1)递归结构,将历史波动率$\sigma{t-1}^2$与残差平方$\epsilon{t-1}^2$作为输入,输出下一步波动率$\sigmat^2$,结构上类似基于标量的RNN单元无激活函数版本。
  • (c) GJR-GARCH输入包含残差符号函数$\mathcal{T}(\epsilont)$使得模型可以捕捉波动非对称性,等价RNN相应拓展输入。

- (d) FI-GARCH对应1D卷积,将带权重的残差平方序列作为输入,通过卷积核$\Lambda$滑动,体现长记忆特征。
  • 意义: 展示GARCH不同模型的统计结构可被RNN/CNN视作特殊网络单元,奠定后续融合的基础。[page::2]


3.2 表1——数据集统计描述

  • 数据覆盖股票指数、外汇及贵金属,多达2500条记录,均通过ADF与KPSS统计检验,均拒绝非平稳原假设,确保时间序列适用建模前提。

- 均值波动范围适中,标准差在0.5到1.9不等,体现多样数据特征。
  • 意义:保证了模型训练数据的平稳性和代表性,有效支持后续验证与泛化测试。[page::3]


3.3 表2——模拟数据下GARCH模型及NN估计参数误差对比

  • 误差(MSE及标准差)近似且较低,说明NN能够准确估计原模型参数。

- 三个模型(GARCH(1,1)、GJR-GARCH、FI-GARCH)均体现此趋势,NN估计表现稳定。
  • 意义: 强烈支持理论上的等价关系,表明NN架构完全可以代替传统GARCH,且参数拟合更通用便捷。

- 这一实验是“理论等价→实践等价”的关键桥梁。[page::4]

3.4 表3——真实数据上GARCH模型与NN模型预测性能对比

  • 记录5个数据集中的MAE和MSE指标,展示双方差异细微且相近,最大差别不大。

- 体现出用神经网络结构表达的GARCH模型在预测表现没有被牺牲。
  • 意义: 强化了GARCH-NN理论迁移至实际数据的可行性。

- 也暗示模型在实际应用中可替代传统GARCH,便于实现神经网络统一框架。
  • 表中部分数据有误或缺失(如极少数空值),但整体趋势清晰。[page::5]


3.5 表4——不同损失函数对传统RNN和LSTM模型的影响

  • T-loss(自由度5)在绝大多数数据集和条件下表现最佳,显著优于传统的MSE损失。

- 说明考虑残差的分布性和统计特征的损失函数设计,对于波动预测任务的提升效果显著。
  • N-loss也明显优于MSE,体现了最大似然方法在金融时间序列预测中的适用优势。

- 意义: 损失函数设计对模型效果影响甚大,极大地推动了GARCH-LSTM模型的成功实践。
  • 该结果也印证本报告对模型训练方法的科学选择和创新。

- 表格数据复杂但核心趋势明确。[page::5]

3.6 表5——多预测期对比评测

  • GARCH-LSTM在1日、3日、1周、2周、1月等多个预测期中,均取得MAE/MSE最优或次优表现。

- 三个经典GARCH模型表现稳健,但普遍不及GARCH-LSTM。
  • 多种Transformer模型表现差异大,多数未能超过GARCH-LSTM,验证深度Transformer不一定适合此类任务。

- GARCH-LSTM在几个资产(标普500、纳斯达克、黄金)上表现尤为突出,平均改进3% MAE,10% MSE。
  • 意义: 实验证明将GARCH模型内嵌神经网络的设计增强了模型泛化能力和长期预测稳定性。

- 该表体现了模型的应用价值和在金融市场实际预测环境中的性能优势。[page::6]

3.7 图2——NASDAQ数据上的VaR违反率示意图

  • 展示了历史收益与三个模型预测区间的5%上下VaR限。

- 违约率聚焦于实际收益超出预测区间的比例:GARCH-LSTM的违约率(上0.28%,下4.19%)明显低于GJR-GARCH(上1.68%,下6.98%),与GARCH(1,1)相比亦有所减少。
  • 趋势上所有模型总违约率都接近5%,符合统计预期。

- 说明GARCH-LSTM在风险界定的准确性和紧致性方面优势明显。
  • 意义: 这样动态的风险度量直观展现了模型在风险管理中的潜在应用价值。

- 实际表明GARCH-LSTM不仅拟合好,还能保证风险界线的科学有效。
[page::6]

---

4. 估值和模型设计分析

  • 虽未经传统财务估值指标,模型主要基于统计拟合和预测准确性评比。

- 采用的GARCH-LSTM作为融合模型,基于以下关键思想:
- GARCH模型特征隐含着重要金融市场的波动率行为特性,尤其波动率聚类、非对称效应及长记忆效应
- LSTM模型致力于捕捉序列的长期和短期依赖
- 通过GARCH-NN等价关系,将GARCH模型转化为神经网络子单元,实现两者结构“共生”,使得NN模型对金融领域的时间依赖结构具备更好的表征能力。
  • 损失函数设计合乎最大似然原理,使得训练更贴近统计推断的理论,提升模型泛化性能。

- 优化器从传统SLSQP升级为ADAM,结合学习率调整和早停策略,适应神经网络训练,同时保证等价关系的实用执行。
  • 参数估计由传统经济计量学的数值方法转向采用反向传播算法,简化模型拟合流程,有潜在自动化优势。

- 整体分析体现模型设计的科学严谨、逻辑清晰与创新融合性。

---

5. 风险因素评估

  • 该框架依赖于波动率序列的平稳假设,数据必须满足一定的统计性质(ADF和KPSS支持平稳性)。

- 训练数据的非平稳、外部冲击、市场结构变化均可能导致模型性能下降。
  • NN模型结构复杂,尽管嵌入了GARCH特征,仍面临过拟合风险,尤其在序列长度和样本稀缺条件下。

- 错误的损失函数选择或参数估计偏差会严重影响模型的预测能力。
  • 估计滑动窗口大小、卷积核长度(FI-GARCH对应CNN)等超参数选择敏感。

- 网络参数对市场大幅波动的响应也可能滞后,影响短期风险衡量的及时性。
  • 报告未明确提出对应缓解策略,但实验中采用了动态学习率和早停等措施,缓解训练过拟合和性能波动。

- 未来研究方向提出将探索更多GARCH模型的NN等价及多模型集成,提高应对不同市场环境的能力。

---

6. 批判性视角与潜在不足

  • 报告基于经典GARCH家族的三个代表模型,扩展至其他模型或高维多资产场景尚待验证。

- 等价关系理论虽然得到模拟与实证支持,但真实市场的非理想情况和极端事件下的鲁棒性未充分讨论。
  • 实验中的深度学习基线大多为Transformer架构,选择NN架构较为基础,适合验证理论,但未在更先进网络架构上广泛测试。

- 损失函数研究较初步,尤其对不同资产波动率结构的适应能力需进一步探索。
  • 违约率测试虽体现趋势,但评价指标较单一,组合风险度量工具尚可增强。

- 报告对于计算效率、模型复杂度等实际落地关键指标阐述有限。
  • 总体科学性强,创新点明确,但未来可增加更多金融实务中多资产、多频次和非平稳处理支持的探讨。


---

7. 结论性综合



本报告通过严谨的数学推导与实证分析,首次系统地构建了经典随机波动率模型GARCH家族与神经网络模型间的等价关系,开创性地提出了能够将波动率“风格特征”有效编码到神经网络结构中的GARCH-NN方法。基于此方法开发的GARCH-LSTM模型,在维护传统经济计量模型解释力的基础上,融合LSTM强大的时序学习能力,多次实证验证在多个全球主流金融资产数据集上相较经典GARCH和前沿深度学习模型均表现出预测性能的显著提升。

关键发现包括:
  • GARCH模型的递归结构可视作特定无激活函数的RNN单元,而FI-GARCH则对应一维卷积核结构,实现了模型结构的自然转译与映射。

- 采用基于最大似然的N-loss与T-loss显著提升了神经网络波动率预测的性能,满足了统计学和机器学习间的连接桥梁。
  • GARCH-LSTM模型因其灵活的内核设计,能够高效捕捉波动率聚类、非对称效应和长记忆效应三大波动率“风格特征”,从而提升长期和短期的预测鲁棒性。

- 违约率风险管理实测结果表明,该模型在金融风控实际应用中能提供更可靠的市场风险界定。
  • 该研究为未来金融时间序列大数据和深度学习融合提供了理论与实践基础。


综上,本报告在金融经济计量学与机器学习的交叉领域开辟了一个创新研究方向,为金融风险管理和资产定价带来新工具,具有高度理论价值和应用推广潜力。[page::0,page::1,page::2,page::3,page::4,page::5,page::6]

---

如果需要,我可进一步提供更细微章节详细解读或特定图表深层剖析。

报告