`

EXTENDING THE APPLICATION OF DYNAMIC BAYESIAN NETWORKS IN CALCULATING MARKET RISK: STANDARD AND STRESSED EXPECTED SHORTFALL

创建于 更新于

摘要

本论文将动态贝叶斯网络(DBN)方法扩展用于直接估计10天97.5% 的期望损失(ES)与应激期ES(SES),以S&P 500作为交易台代理,比较了三种DBN结构学习算法与若干传统风险模型(ARCH/GARCH/EGARCH/RiskMetrics/历史模拟/Delta-normal),并在1991–2020年的7,286个滚动样本上进行回测与误差评估。主要发现:所有模型在统计回测上均未能在97.5%显著性水平下通过(反映极端尾部建模困难);在ES预测中EGARCH(正态)表现最佳,在SES中GARCH(正态)最优;当改用偏斜Student’s t分布时,基于分布的模型整体表现显著恶化;DBN相当于历史模拟,但其在尾部预测上的作用受限于只占返回分布中一日向前的较小权重,建议未来研究探索增加DBN前瞻预测权重的加权方案以增强尾部预测能力 [page::0][page::21]

速读内容


研究目标与样本 [page::0][page::7]

  • 目标:将DBN应用于10天97.5% ES与SES的直接估计,并与多种传统模型比较性能(包括用正态与偏斜Student’s t分布校准的ARCH/GARCH/EGARCH/RiskMetrics,以及历史模拟与Delta-normal)[page::0][page::8]。

- 样本:S&P 500 日收盘价,样本期 1991-03-15 至 2020-02-14,生成7,286个滚动的10天ES/SES预测;用于BN训练/校准的滚动窗口长度为1,264天[page::7][page::8]。

DBN 方法要点与实现细节 [page::8][page::9]

  • 使用三种结构学习算法:MMHC、PC (Stable)、SI-HITON-PC;每次训练使用1,264天滚动训练期,选取最小AIC的结构;预测采用一日向前的DBN返回预测并合并到10天重叠返回分布中[page::8]。

- 输入变量:41个宏观与金融变量(见附录A),非日频数据采取前值填充以形成完整日序列;使用 dbnR 等包实现[page::9][page::27]。
  • 回测与评价:采用BCBS交通灯、Acerbi & Székely 的条件回测与最小偏差回测,以及Du–Escanciano独立性回测;并用MAE、RMSE、MAPE(SMAPE替代在零收益时)评估预测效率[page::6][page::10][page::11]。


ES模型:突破次数与回测结论 [page::12][page::14]


| 模型 | 正态分布(Breaches) | 偏斜Student’s t(Breaches) |
|------|----------------------:|-----------------------------:|
| ARCH(1) | 19 | 19 |
| GARCH(1,1) | 10 | 21 |
| EGARCH(1,1) | 8 | 2 |
| RiskMetrics | 11 | 18 |
| Historical Simulation | 3 (分布无关) | — |
| Delta-Normal | ? (分布无关) | — |
| BN (MMHC / PC / SI-HITON-PC) | 3 / 3 / 3 | — |
  • 说明:历史模拟与三种BN在ES上仅出现3次突破,EGARCH(偏斜t)仅2次突破;但条件与最小偏差回测总体拒绝模型的统计准确性,BCBS交通灯均为“Green zone”(不足以证明统计准确)[page::12][page::13][page::14]。


ES 预测误差(关键结果摘要)[page::15]


| 模型 | 分布 | MAE | RMSE | MAPE |
|------|------:|----:|-----:|------:|
| EGARCH(1,1) | 正态 | 0.0546 | 0.0669 | 45.650% |
| GARCH(1,1) | 正态 | 0.0559 | 0.0717 | 46.842% |
| Historical Simulation | — | 0.0917 | 0.0987 | 96.973% |
| BN (PC/ SI-HITON-PC) | — | ~0.0917 | ~0.0987 | ~96.97% |
  • 说明:在ES任务中,EGARCH(正态)在误差度量上最佳;BN与历史模拟性能相当且总体落后于多数自回归波动模型,表明BN在10天ES的贡献受限于其在返回PDF中仅占一日预测的权重[page::15][page::16]。


SES(应激ES)要点与比较 [page::16][page::19]

  • SES校准使用“最严重”1,264天窗(非必须连续)构建应激期;大多数模型在SES上出现更少的突破,许多偏斜t校准的模型没有任何突破[page::8][page::16]。

- 替代误差度量(MAE/RMSE/MAPE)显示:GARCH(正态)在SES预测中表现最佳,EGARCH(正态)次之;总体上改用偏斜t会导致大范围准确性下降[page::19][page::20]。

对DBN的理解与建议(量化/模型相关) [page::8][page::22]

  • DBN核心思想:以结构学习识别变量间因果/条件依赖,生成条件分布并进行一日向前预测,然后将该预测并入10天重叠返回分布以计算ES/SES;训练采用滚动窗口与AIC最优结构选择,输入集覆盖41个候选变量[page::8][page::9][page::27]。

- 限制与改进方向:当前实施中DBN的1天前瞻预测在10天返回分布中权重较小(1/10-day-blocks组成的校准分布中只占1/1,264的部分),因此对尾部贡献有限;建议未来研究探索对DBN前瞻预测赋更高权重或设计加权方案以提高尾部灵敏度并提升ES/SES准确性[page::16][page::22].

深度阅读

元数据与概览(引言与报告概览)
  • 报告标题为“EXTENDING THE APPLICATION OF DYNAMIC BAYESIAN NETWORKS IN CALCULATING MARKET RISK: STANDARD AND STRESSED EXPECTED SHORTFALL”,作者为 Eden Gross、Ryan Kruger 与 Francois Toerien,隶属南非的学术机构(University of the Witwatersrand 与 University of Cape Town),主题为使用动态贝叶斯网络(DBNs)估算 10 日 97.5% 的期望损失(ES)及受压期望损失(SES),并与传统市场风险模型比较。[page::0]

- 核心论点:作者主张将 DBN 扩展用于直接计算 10 日 97.5% ES 和 SES,以期借助 DBN 的因果学习与滚动更新能力改善极端尾部风险的预测,并与多种传统方法(历史模拟、ARCH/GARCH/EGARCH、RiskMetrics、delta-normal 等)在正常与偏态 Student’s t 分布下比较性能。[page::0]
  • 结论性摘要:回测显示所有模型在 2.5% 尾部上无法达到统计准确(被若干回测拒绝),EGARCH(正态)在 ES 上相对最优,GARCH(正态)在 SES 上相对最优;分布改用偏态 t 会普遍降低基于分布模型的表现;DBN 与历史模拟表现可比,但其对尾部贡献受限于在返回分布中仅占单日前瞻性预测这一小权重。[page::0]


逐节深度解读
1) 引言(Section 1)
  • 报告指出监管自 Basel III/IV 强制转向 ES 及 SES(10 日 97.5%),强调 SES 需要基于包含 2008 危机的“受压期”校准区间进行计算,并允许内部模型但需直接给出 10 日 97.5% 的 ES/SES 预测。[page::1]

- 作者提出用 DBN 学习宏观与金融变量对 S&P500(作为美国产权交易台回报代理)的因果关系,从而生成前瞻性回报预测并纳入回报分布以计算尾部指标;他们采用动态 BN 以同时捕捉时间内与跨期交互(对金融时间序列更适配)。[page::1][page::2]
  • 对受压期的确定采用 Gross et al. (2025) 的“滚动并合并最严重若干日”方法(非必要连续日),以获得更保守的 SES 校准样本。[page::2]


2) 文献回顾与技术背景(Section 2)
  • 报告回顾 ES 的定义与性质(ES 为在 VaR 之上发生损失的期望,是相干风险度量),并以数学式给出 ES 与 VaR 的关系式与形式化定义,强调 ES 需先计算 VaR 并以其为条件来求尾部期望。[page::3][page::4]

- 传统模型(历史模拟、delta-normal、ARCH(1)、GARCH(1,1)、EGARCH(1,1)、RiskMetrics)的参数化与波动率方程被列出并解释,例如 EGARCH 采用对数方程以捕捉杠杆效应,RiskMetrics 为指数加权移动平均,且作者对部分模型用正态或偏态 t 拟合对数似然进行估计。[page::4][page::5]
  • 回测方法论:讨论 BCBS “交通灯”测试的机制及其局限性,同时引入 Acerbi & Székely 的条件回测(conditional backtest)与最小偏差回测(minimally biased backtest)以及 Du-Escanciano 的独立性/聚类检测(Portmanteau 风格)用于检验 ES 的序列独立性与拟合质量。[page::6][page::10]


3) 数据与方法(Section 3)
  • 数据:S&P500 日收盘价 1991-03-15 至 2020-02-14,用于生成 7,286 个滚动的 10 日 97.5% ES/SES 离线外样本预测;回报以对数收益计算,样本回报均值 0.03%,标准差 1.10%,偏度 -0.28,峰度 12.10(表明厚尾)。[page::7][page::8]

- DBN 训练:使用 41 个宏观/金融变量(见附录 A)并通过三种结构学习算法:PC (Stable)、MMHC、SI-HITON-PC,采用 1,264 日滚动训练窗,模型选择以最小 AIC 为准;非日频数据采用前值填充以满足算法对完整数据的需求。[page::8][page::9]
  • 预测与校准:传统模型用 1,264 日滚动校准期估计并直接计算重叠的 10 日回报(不缩放)以符合 BCBS 要求;SES 的校准期由“最严重的 1,264 日”构成(前述合并法)。[page::8][page::11]


图表与表格深度解读(关键表格)
  • 表 1(10-day 97.5% ES 违约次数,见 report p12):该表列出 ARCH(1)、GARCH(1,1)、EGARCH(1,1)、RiskMetrics 在正态与偏态 t 下的违约次数,以及三种 BN 与历史/Delta 的违约情形(历史与三 BN 均为 3 次违约,EGARCH 偏态 t 仅 2 次),说明:

- 具体数字解读:ARCH = 19(两分布同),GARCH 正态 10 → 偏态 21(显著恶化),EGARCH 正态 8 → 偏态 2(改善),RiskMetrics 正态 11 → 偏态 18(恶化),BN(MMHC, PC, SI-HITON-PC)均为 3 次违约且这些违约日期与历史模拟相同(1997-10-27、1998-08-31、2008-09-29)。这些数字直接显示不同模型在尾部事件计数上的不一致性与对分布假设的高度敏感性。[page::12][page::13]
- 图像占位(源文表格引用展示): 说明:此为报告中 Table 1 的相对路径占位,便于读者直观参照该表数据。[page::12]
  • 条件回测结果表(Table 2,见 p13–14):该表表明对于能执行条件回测的模型(存在至少一个 VaR 违约),在 97.5% 置信区间下多数模型被拒绝(即预测不准确),而对某些模型因无对应 VaR 违约而无法执行该回测(“Cannot perform backtest”)。这说明单纯观测违约次数不足以说明模型质量,条件回测强调 ES 与 VaR 的联合检验。[page::13][page::14]
  • 预测误差表(Table 3, ES 的 MAE/RMSE/MAPE,见 p15):

- 关键观察:在 ES 误差度量上,EGARCH(正态)在 MAE=0.0546、RMSE=0.0669、MAPE≈45.65%(表中最优);但 EGARCH(偏态 t)误差暴增(MAE=0.2369,RMSE=0.4394,MAPE≈263.92%),显示偏态 t 在该情形下导致严重退化;历史模拟与三 BN 的 MAE/RMSE 均约 0.0917/0.0987,MAPE 约 97%,表明 DBN 对尾部预测的实际改进有限且接近历史模拟水平。[page::15]
- 图像占位: 该表格强化结论:分布改变对某些模型影响巨大,而 BN 因其在 PDF 中仅贡献单日预测而无法显著改变整体尾部统计特性。[page::15][page::16]
  • SES 违约与误差表(Tables 4 & 6,见 p16–19):

- Table 4(SES 违约计数)显示多数模型在 SES 下违约更少(许多为 0),尤其 BN 三算法在整个样本期对 SES 完全无违约,这与 SES 校准阶段使用历史“最严重”样本有关,导致模型更保守(违约被抑制)。[page::16][page::17]
- Table 6(SES 的 MAE/RMSE/MAPE)指出在 SES 误差指标里 GARCH(正态)在 MAE=0.0834、RMSE=0.0892、MAPE≈88.82% 最优,历史模拟在 SES 上误差较大(MAE≈0.17),BN 的误差与历史模拟相近(MAE≈0.17,MAPE≈178%),表明 DBN 在 SES 上同样未能显著优于简单方法。[page::19]
- 图像占位: 该图示强调 SES 校准使得多数模型变得极度保守且误差度量较 ES 更高,BN 与历史模拟误差接近,进一步支持作者关于 BN 权重问题的断言。[page::19]

估值/预测模型解释(报告并无企业估值,但需解释方法学)
  • 报告未包含公司估值模型,但详细列出用于风险预测的统计/时间序列模型与其关键参数化假设:ARCH/GARCH/EGARCH 的方程表达、RiskMetrics 的 lambda=0.94、以及对正态与偏态 Student’s t 两种分布的拟合选择,说明作者在建模时分别考察了条件波动性结构与分布厚尾与偏斜对尾部度量的影响。[page::4][page::5]


风险因素评估(来自报告)
  • 报告识别的关键风险与局限性包括:ES 不具可引导性(not elicitable)使得回测困难且必须依赖间接或联合 VaR/ES 回测方法;分布假设错误(正态或偏态 t)会显著影响尾部预测与回测结论;DBN 的实际贡献受限于在返回 PDF 中仅包含单日前瞻预测的“权重”问题,从而很难在 10 日重叠返回的校准中主导尾部结构。[page::6][page::22]

- 对监管回测的局限性:BCBS 交通灯常给出“Green”即使模型统计不准确,因此不能替代更严密的统计回测;Du-Escanciano 检验对传统模型拒绝了正态/偏态 t 的拟合,表明这些分布并非真实尾部分布的良好模型。[page::6][page::20]

批判性视角与细微差别
  • 偏见与方法限制:作者一方面推崇 DBN 的因果与前瞻能力,但在实证部分承认其改进有限且结果多被历史样本主导,暗示 BN 方法在当前实现方式下不能释放理论潜力(主要因 BN 在返回分布中只占单日预测权重),这一点作者明确指出并建议未来调整加权方案。[page::22]

- 分布选择悖论:尽管偏态 Student’s t 通常被认为更能捕捉金融返回的厚尾与偏斜,但在本研究中对多数自回归模型与 EGARCH(尤其)导致性能恶化,作者多次检验并确认结果一致,这可能反映参数估计、极端值样本或与滚动校准窗口的相互作用,而非偏态 t 本身必然劣于正态;因此一定要谨慎解读“偏态 t 不适合尾部”的结论并进一步探究估计稳定性。[page::15][page::19]
  • 数据与实现注意:DBN 使用前值填充非日频数据是一种实务选择(反映风险经理现实),但此策略可能引入滞后信息并影响结构学习的动态识别;作者虽引用 Gross et al. (2025) 作为依据,但这同样是 DBN 应用的潜在局限之一。[page::8][page::27]


结论性综合
  • 主要发现综合:在 1991–2020 的 7,286 天外样本回测中,所有模型在严格的统计回测(Acerbi & Székely 的条件/最小偏差回测与 Du-Escanciano)下总体被判定为统计不准确(被拒绝),而 BCBS 交通灯测试对所有模型均给出 Green(监管层面“合格”但统计上并不足以证明准确性)。[page::20]

- 在误差指标上,ES 的最优为 EGARCH(正态),SES 的最优为 GARCH(正态),但这些“最优”仍在不同误差度量下表现相对有限,且偏态 Student’s t 在本研究中普遍导致模型性能下降,尤其对 EGARCH 的影响最显著(误差激增数百百分比)。[page::15][page::19]
  • 关于 DBN 的贡献:DBN 与历史模拟在 ES/SES 的误差度量上接近且多数情况下未能超越常见自回归模型;作者指出限制来自于在校准生成的混合返回分布中 DBN 仅为“单一一日前瞻”来源,建议未来研究考虑提高 DBN 在 PDF 中的权重或改变加权机制以发挥其前瞻价值。[page::16][page::22]

- 最后评价(基于报告):研究对比全面、样本长期且方法学严谨(多模型、多分布、多回测、多误差指标),结论客观并指出 DBN 实证应用的现实限制与未来改进方向,为将来在市场风险管理中引入更多前瞻性机器学习/因果方法提供了明确的研究路径与实务注意事项。[page::7][page::22]

附:重要表格的引用占位(原文表格位于指定页)
  • Table 1 占位: [page::12]

- Table 3 占位(ES 误差): [page::15]
  • Table 6 占位(SES 误差): [page::19]


(结束语)以上分析力求对报告的结构、每一重要论点、关键数据、表格内容、方法学假设、回测结果与局限性做详尽剖析与客观评述,并在引用具体结论或数据时标注了原文页码以便溯源与复核。[page::0][page::22]

报告