`

Loss-based Bayesian Sequential Prediction of Value at Risk with a Long-Memory and Non-linear Realized Volatility Model

创建于 更新于

摘要

本文提出了融合递归神经网络(RNN)与长期记忆异质自回归(HAR)模型的新型RNN-HAR模型,实现了对风险价值(VaR)的直接预测。该模型利用基于损失函数的广义贝叶斯推理和序列蒙特卡洛(SMC)方法进行估计和预测,避免了对收益分布的假设。通过对2000至2022年31个市场指数的实证检验,结果显示该模型在单步VaR预测方面显著优于传统HAR及其扩展模型,展现出更强的非线性动态捕捉能力和预测准确性[page::0][page::2][page::6][page::19][page::10][page::13][page::19]

速读内容

  • 研究提出RNN-HAR模型,将递归神经网络(RNN)集成入HAR模型,分别针对每日、每周和每月的实现波动率数据进行建模,捕捉长期记忆和非线性动态影响,提升VaR预测准确率[page::5][page::6]。

- RNN-HAR模型避免了收益分布假设,采用基于分位数得分(Quantile Score)的损失函数进行广义贝叶斯推断,结合序列蒙特卡洛(SMC)方法进行模型参数估计和序贯预测,具有更高的鲁棒性与实用性[page::6][page::7][page::8]。
  • 实证数据涵盖2000-2022年31个市场指数,使用公开的Oxford-man实现波动率库数据,数据处理包括3000个观测期,分为2000个内样和1000个外样,涵盖金融危机和新冠疫情等市场波动事件,确保样本代表性和稳健性[page::10][page::11][page::12]。

- 对比包括传统HAR模型及其扩展(如SqrtHAR、LevHAR、RHARGARCH模型),但只有RNN-HAR模型直接预测VaR,其他模型通过预测实现波动率间接计算VaR[page::12][page::13]。
  • 关键性能指标评估显示:

- 分位数得分(QS)方面,RNN-HAR模型在α=1%、2.5%、5%三种显著性水平下分别取得了超过77%、71%、51%的市场最好表现比例。
- VaR违规率(VRate)测试中,RNN-HAR在31个市场中均表现最好,显著优于其他模型,违规率更接近预设显著率α。
- Diebold-Mariano带Quandt-Andrews断点的DQ检验表明,RNN-HAR模型被拒绝的次数最少,模型稳定性和准确性更优。
- 尾部损失比率(Tail Loss Ratio)中,RNN-HAR模型在大多数市场也表现优异,说明极端风险识别能力强。


以上指标一致验证RNN-HAR模型在VaR预测中的优势[page::13][page::14][page::15][page::16][page::17][page::18]。
  • 量化策略与因子构建方面:

- 以简单RNN结构分别拟合每日、每周、每月实现波动率数据,使用tanh激活函数,形成三个隐状态序列构成的非线性状态空间,结合线性回归参数构建VaR预测函数。
- 训练过程中采用分位数损失函数,避免对收益分布做出假设,参数通过基于该损失的贝叶斯后验分布采样估计。
- 模型参数估计和逐步预测均借助序列蒙特卡洛(SMC)方法,支持在线学习与逐步调整,提升预测能力和动态适应性。


该量化框架体现了利用传统金融计量模型与现代深度学习结合的典范[page::6][page::7][page::8][page::9][page::10]。
  • 未来研究方向建议引入更复杂的长短期记忆网络(LSTM)结构并结合多种实现波动率指标,以进一步提升模型预测的稳定性和精度[page::19]。

深度阅读

金融研究报告详尽分析报告



---

1. 元数据与概览


  • 报告标题: Loss-based Bayesian Sequential Prediction of Value at Risk with a Long-Memory and Non-linear Realized Volatility Model

- 作者: Rangika Peiris、Minh-Ngoc Tran、Chao Wang、Richard Gerlach
  • 发布机构: 悉尼大学商学院商业分析学科

- 发布日期: 2024年8月27日
  • 研究主题: 提出并验证一种基于长记忆与非线性脉络的波动率模型(RNN-HAR)用于直接预测风险价值(VaR),并采用带有损失函数的贝叶斯推断结合序列蒙特卡洛(SMC)方法进行模型估计和逐步预测。


报告核心论点:
该报告主要提出了一种基于异质自回归(HAR)模型扩展的长记忆非线性波动率模型RNN-HAR,其中融入递归神经网络(RNN)以捕捉非线性动态特性,并通过基于损失的广义贝叶斯推断和序列蒙特卡洛实现模型估计和VaR预测。实证数据涵盖2000-2022年31个市场指数,结果显示该模型在一次性前瞻VaR预测性能上超越传统HAR模型及其多种扩展,具备显著优势。

关键词: HAR模型、递归神经网络、分位数评分、序列蒙特卡洛、广义贝叶斯推断。[page::0]

---

2. 逐节深度解读



2.1 引言部分



报告开篇指出,准确预测金融市场波动率对于风险管理、资产定价和合规资本准备至关重要。传统波动率模型如GARCH和随机波动率模型虽广泛应用,但面对高频数据时存在捕捉长期依赖和非线性行为的不足。HAR模型因能有效使用高频数据的实现波动率序列,成为长记忆波动建模的重要工具,但仍存在对返回序列忽视、模型噪声及线性限制的问题。报告的核心贡献即提出一套集成返回序列及非线性机制(RNN)的新型模型来改进预测性能。[page::1]

主要论点及推理:
  • 传统GARCH和随机波动率模型适用于日常数据,但难以捕捉高频数据中的复杂动态和长期记忆。

- HAR模型作为“长记忆”波动率的近似工具,通过多时间尺度的实现方差捕获了波动率的持久性。
  • 但仅依赖实现波动率的HAR模型可能会被数据噪声困扰,忽视了返回序列所含有的重要市场信息。

- 因此,扩展包含返回序列不仅改善建模精度,还能提高金融风险管理中的VaR预测能力。

---

2.2 HAR模型及其扩展(背景模型,章节2)



本节详细介绍了Corsi (2009)提出的HAR模型框架,核心是利用日、周、月三个时间尺度上的实现波动率序列作为回归自变量,以线性回归方式建模未来实现波动率。
  • 模型从潜在局部波动率定义开始,递归表达为多时间尺度实现波动率的加权和,含噪声分量用于捕捉测量和估计误差。

- HAR的线性结构允许多种扩展,例如对实现波动率做变换的SqrtHAR模型,捕捉杠杆效应的LevHAR模型,以及半方差HAR (SHAR)和HARQ模型,但由于数据限制,部分模型未参与实证测试。
  • Realized-HAR-GARCH模型融合了HAR的长记忆特性至GARCH框架,但同样未直接用于VaR预测。


关键公式如HAR模型的基本形式:
$$
RV{t+1} = c + \beta^d RVt^d + \beta^w RVt^w + \beta^m RVt^m + \omega{t+1}
$$
其中$d,w,m$分别代表日、周、月期的实现方差。

评述:尽管这些模型有效捕捉了分位波动率的动态,均缺乏对返回序列的充分利用及VaR的直接预测方法,限制了在风险管理的直接应用,因此提出了将RNN集成进HAR框架的动机,以捕捉非线性关系和长期依赖结构。[page::3-5]

---

2.3 提出模型——RNN-HAR(章节3、6)



模型设计原理

  • 将递归神经网络(RNN)引入HAR框架,通过三个分别处理日、周、月实现方差数据的RNN结构,捕获非线性动态及长短期依赖。

- 直接以VaR分位数作为目标变量,通过最小化分位数损失函数(Quantile Score, QS)实现模型训练,规避传统参数模型对返回分布的假设。
  • 模型表达为:


$$
\begin{aligned}
\mathrm{VaR}
{t+1}^\alpha &= \beta0 + \beta1 h{t+1}^d + \beta2 h{t+1}^w + \beta3 h{t+1}^m \\
h
{t+1}^d &= \mathrm{RNN}(RVt^d, ht^d) = \phi(\alpha0^d + \alpha1^d RVt^d + \alpha2^d ht^d) \\
h
{t+1}^w &= \mathrm{RNN}(RVt^w, ht^w) = \phi(\alpha0^w + \alpha1^w RVt^w + \alpha2^w ht^w) \\
h
{t+1}^m &= \mathrm{RNN}(RVt^m, ht^m) = \phi(\alpha0^m + \alpha1^m RVt^m + \alpha2^m h_t^m)
\end{aligned}
$$

其中$\phi$为tanh激活函数,$h$为隐含状态变量。

关键论点

  • 模型基于直接预测VaR的分位数而非传统HAR中的实现波动率预测,有效对冲利用返回数据中的信息,且避免成立返回分布假设的局限。

- RNN结构具备处理序列数据中的复杂非线性及长记忆能力,优于传统线性回归。
  • 利用分位数得分(QS)作为损失函数,训练出的VaR预测具有统计学一致性。[page::5-6]


---

2.4 贝叶斯推断与序列蒙特卡罗方法(章节4)



为处理RNN-HAR中非标准的模型结构和损失函数,报告采用基于损失函数的广义贝叶斯推断,不依赖于数据的具体分布假设,结合序列蒙特卡罗(SMC)算法实现参数估计及预测。
  • 广义贝叶斯推断: 以损失函数替代概率似然作为贝叶斯更新的基础,适合无明确定义似然或数据分布复杂的情形。

- 本文采用了异步拉普拉斯分布(Asymmetric Laplace)与量化损失对应,借此构造广义似然。
  • 先验设定为弱信息先验,如正态分布分别给RNN和回归参数设定。


SMC方法细节:
  • 采用两种方式:似然退火方法用于训练模型(模拟从先验到后验的过程)和数据退火方法用于扩展窗口的滚动预测。

- SMC通过权重重采样和马尔科夫链蒙特卡洛步骤,动态调整抽样质量。
  • 设定如粒子数2000,退火层数10000等参数保障计算稳定性。


这种方法保证了模型参数的灵活估计,并能有效实现增量式更新以方便动态市场环境中的风险管理。[page::7-10]

---

2.5 数据与实证应用(章节5)



实证部分基于Oxford-Man Institute提供的高频数据,时间跨度2000年至2022年,覆盖31个主要市场指数,抓取了包括2008年金融危机和COVID-19疫情等多重市场波动事件。
  • 标准化所有序列长度至3000日,测试期取后1000日。

- 展示SPX(标准普尔500)日绝对收益与5分钟实现波动率的时间序列示例图(图1),两者高度波动且形态契合。
  • 市场统计描述表(表2)显示BVSP出现最高标准差,IXIC拥有最高平均回报特征,反映新兴市场与发达市场的异质性特征。


这些数据为模型训练与性能测试提供了坚实基础。[page::10-12]

---

2.6 一步预测与性能评估(章节5.1-5.2)



预测策略:
  • 采用扩展窗口和SMC数据退火方式实现时点$t$后一步VaR预测,根据后验样本取均值为点预测。

- 除RNN-HAR直接预测VaR外,其它模型(HAR及扩展型)预测实现波动率后,通过假设条件均值和正态分布转换为VaR。

性能评测指标:
  • 分位数得分(Quantile Score, QS): 核心指标,衡量VaR预测的准确性,越低越好。

- VaR违规率(VRate): 实际超过VaR次数比例,理想应接近理论分位数$\alpha$,即VRate/$\alpha$近1才说明模型合规。
  • Diebold-Mariano带Quandt-Andrews断点检测的DQ测试: 检测VaR模型在预测序列上的受检精确性,拒绝次数越少越好。

- 尾部损失比(Tail Loss Ratio): 衡量超过VaR阈值部分的损失大小,越低越好,反映模型对极端风险的管理能力。

结果解读:
  • 表3分位数得分显示,RNN-HAR在31市场中分别在1%(77%市场)、2.5%(71%市场)、5%(51%市场)分位点获最佳结果。

- 表4违规率则显示RNN-HAR模型在1%、2.5%分位点分别仍在90%以上市场表现最优,5%分位点表现亦领先(77%)。
  • 表5的DQ检验中,RNN-HAR的拒绝次数远少于其他模型,统计上显著优于对手。

- 表6尾部损失比续显示,在1%、2.5%、5%的多个市场中大部分时间RNN-HAR模型优于其他模型,但该指标表现稍有下降(1%最好,5%次之)。

综合以上指标,RNN-HAR模型在捕获VaR异常、保证风险预测合理性和极端事件适应性方面均显示其出色性能。[page::13-18]

---

2.7 结论(章节6)



报告总结认为RNN-HAR模型通过引入递归神经网络处理多时间尺度实现波动率,结合基于分位数损失的贝叶斯推断和SMC估计,有效提供了直接的VaR预测。该模型在实证中覆盖31个市场指数、长达20余年数据,大幅优于包括HAR及多种扩展模型的表现。

未来研究可进一步结合LSTM结构及多元实现波动率指标,以提升模型的预测准确性和鲁棒性。[page::19]

---

3. 图表深度解读



3.1 图1:SPX的绝对收益和实现波动率时间序列图



该图描绘了时间跨度内SPX指数的每日绝对收益与5分钟实现波动率的走势。图中蓝线代表每日绝对收益,橙线代表实现方差。
  • 观察可见两条曲线形状波动高度同步,显示了收益绝对值与实现波动率的同向动态特征。

- 在2008金融危机及2020新冠疫情爆发期间,波动幅度显著上升,反映出金融市场剧烈动荡。
  • 该图直观表现了高频数据捕获的市场波动特征,支持利用实现波动率作为波动性估计的重要性基础。


该图为全报告中基于高频实现波动率的模型研究奠定数据背景。[page::11]

---

3.2 表2:31个市场的返回序列描述统计



该表列出了覆盖市场每天3000个观测值下的回报均值、标准差、偏度、峰度及极值。
  • 如巴西BVSP市场显示标准差最高(1.575),表明该市场波动最大,匹配其新兴市场地位。

- 纳斯达克IXIC拥有最高均值(0.0358),代表较强的长期收益表现。
  • 负偏度普遍出现,提示左尾风险较大,峰度普遍偏高,说明返回分布厚尾现象明显。


这些统计揭示市场多样性,说明模型须能适应不同市场下的波动和风险特征。[page::12]

---

3.3 表3-6:VaR预测性能比较表(部分)


  • 表3(Quantile Score):展示31市场上不同模型在1%、2.5%、5%不同置信度下的分位损失得分,RNN-HAR模型多半市场名列第一,数值最小。

- 表4(VaR违规率):显示实际亏损超出VaR预测的频率,最理想值接近预设水平$\alpha$。RNN-HAR模型多次接近目标比例,且分布均匀。
  • 表5(DQ测试):统计各模型被检验拒绝次数,RNN-HAR低得多,显示模型预测序列符合规范特性。

- 表6(尾部损失比):度量超过VaR部分的累计损失,RNN-HAR在多数情况下优于竞争模型,说明更好地控制极端风险。

这些表格佐证了全文论断,通过多指标、多市场与多置信区间的考量,RNN-HAR的整体表现领先,且表明对风险尾部控制及动态适应性表现优异。[page::13-18]

---

4. 估值分析



本报告核心为风险预测模型提出与实证,对估值分析未做直接涉及,无传统意义上的估值模型如DCF或P/E方法等,也未涉及目标价制定,故不适用估值分析框架。

---

5. 风险因素评估



报告虽未专门设立风险章节,隐含风险来自模型建构及应用层面对以下风险的识别:
  • 数据噪声及缺失风险: HAR模型依赖实现波动率,部分实现波动率可能受噪声干扰,传统HAR对返回信息利用不足。

- 模型假设风险: 传统参数模型需假设返回分布,RNN-HAR避免此限制。但RNN可能过拟合或结构选择不当。
  • 计算复杂性与可扩展性: 贝叶斯SMC涉及高计算成本,应用于极大数据或多维时风险上升。

- 市场结构变化风险: 因使用19年的历史数据,潜在经济结构变更可能影响模型的长期预测稳定性。

缓解策略体现在利用分位数损失函数要求,非依赖定式分布,并采用广义贝叶斯推断与SMC实现具有鲁棒性参数统计。

---

6. 批判性视角与细微差别


  • 线性假设与非线性建模的平衡: 虽RNN引入了非线性建模能力,但本报告使用的是简单RNN结构(Tanh激活),未引入更复杂如LSTM或GRU,可能限制了捕获更复杂长短期依赖的能力。

- 数据限制的影响: 实证未能涵盖所有已知的HAR模型扩展(如SHAR、HARQ等)因缺少半方差或四阶矩数据,有待未来丰富数据后进一步验证。
  • 贝叶斯广义框架的解释性: 损失驱动贝叶斯更新较少依赖概率机制,虽然具有灵活性,但对传统统计推断的解释性可能减弱,模型验证需更细致。

- 模型预测的稳健性测试有限: 报告重点在整体指标表现,细分市场极端事件的具体表现和模型的稳健性尚需深入分析。

---

7. 结论性综合



本报告系统提出并验证了一种融合递归神经网络的长记忆非线性HAR模型——RNN-HAR,专门针对金融市场的风险价值(VaR)预测,且采用了基于分位数损失的广义贝叶斯推断结合序列蒙特卡罗技术实现参数估计和动态预测。
  • 理论贡献:

- 将返回序列与实现波动率信息有效结合,弥补传统HAR对返回数据忽视的不足。
- 通过RNN捕获复杂非线性和长期依赖,提高了VaR预测的精度和鲁棒性。
- 利用损失函数驱动的贝叶斯推理避免对返回分布的刚性假设,增强模型适用性。
  • 实证贡献:

- 使用2000-2022年间31个全球重要市场指数数据,实证评估模型性能。
- 在分位数损失(Quantile Score)、VaR违规率(VRate)、DQ检验和尾部损失比等多个风险管理关键指标上,RNN-HAR均显著优于传统HAR及其主流扩展模型。
  • 图表支持的见解:

- 图1展现高频实现波动率与收益绝对值的同步波动,验证实现波动率的市场信息价值。
- 表2市场统计彰显不同市场波动与风险特征,为模型跨市场适用性提供基础。
- 表3-6多角度评估模型具有稳健高效的风险预测表现,尤其是在极端风险管理上的优势明显。

综上,报告明确展示RNN-HAR作为一种创新且有效的金融波动率和VaR预测工具,具备理论深度与强劲的实证表现。该模型为风险管理和资产定价领域提供了强有力的技术支持,为未来进一步深度融合深度学习和金融计量方法树立了典范。[page::0-20]

---

附录


  • 参考文献涵盖 HAR及其扩展理论、RNN深度学习算法、贝叶斯推断及SMC技术等多学科领域,表明本研究交叉融合了前沿统计学与金融工程方法。

- 数据来源与设置详尽合理,保障了研究的严谨性和实用价值。

---

该分析意在为金融模型研究者、风险管理专家及资产管理机构提供系统而深入的机械理解与评价,帮助其理解前沿模型构建和数据驱动VaR预测的复杂性与优势。

报告