Combining a Large Pool of Forecasts of Value-at-Risk and Expected Shortfall
创建于 更新于
摘要
本文针对VaR及ES风险测度的多模型预测组合问题,创新性地结合90个单模型的预测结果,提出并系统评估包括基于中心趋势、区间预测结合、正则化加权及平滑过度等多种组合方法。实证涵盖六大指数数据,结果显示概率平均和修剪均值等方法能显著提升风险预测准确性,且优于传统动态模型选择,突显组合策略对于提升风险管理可靠性的价值 [page::0][page::2][page::15][page::21][page::26]
速读内容
研究背景与目标 [page::0][page::1]
- VaR和ES是金融风险管理中广泛使用的风险指标,且ES因其子可加性优于VaR。
- 多种单模型预测方法(如GARCH、CAViaR、CARE、历史模拟等)已被广泛提出。
- 本文核心创新是探索90个多样化单模型的预测组合,提高风险预测准确性。
数据与方法概述 [page::3][page::4][page::30]
- 选取六个主要股指(日度高低价、收益率及5分钟实证波动率),共5400个样本,滚动窗口1800天回避样本预测。
- 采用多种统计中心趋势方法(均值、中位数、模式)、区间预测结合(多种修剪均值、概率平均、深度统计)、性能加权方法及平滑过渡组合方法进行预测组合。
- 概率平均方法通过拟合每个模型对应VaR和ES所隐含的CDF,进行CDF层面的平均,获得更极端的风险预测。
量化策略核心方法—性能加权及修剪均值 [page::9][page::14][page::15][page::16][page::11]
- 性能加权方案(相对分数法和最小分数法)利用Fissler-Ziegel的联合评分方法,对90个方法动态调整权重,特别设计了正则化以避免过拟合。
- 修剪均值系列(对VaR和ES中高端或低端修剪一定比例预测值)能调整风险预测极端度,解决原始均值预测低估风险的问题。
- 模式结合使用核密度估计提取最可能的VaR和间距预测,实现鲁棒组合。
主要实证结果与评价 [page::19][page::20][page::21][page::22][page::23]

- 校准测试显示概率平均和最小分数等多种组合方法未拒绝所有检验,表现优。
- 多种评分指标下,所有组合方法均显著优于动态选择单一最优模型,修剪均值(尤其高端修剪)与概率平均表现最优。
- 正则化加权组合和组合方法简单平均效果也十分突出,尤其在估计样本缩短情况下表现更稳健。
- 平滑过渡结合允许动态权重调整,展示了实用价值。
未来研究方向与应用意义 [page::26]
- 提议在不同市场、资产类别及极端风险时期继续检验组合方法有效性。
- 组合框架为风险资本分配及监管合规提供更可靠的风险预测手段。
深度阅读
报告详尽分析报告 — 《Combining a Large Pool of Forecasts of Value-at-Risk and Expected Shortfall》
---
一、元数据与概览
- 报告标题:《Combining a Large Pool of Forecasts of Value-at-Risk and Expected Shortfall》
- 作者:James W. Taylor(牛津大学Saïd商学院)、Chao Wang(悉尼大学商学院)
- 核心主题:对金融风险管理中两个关键风险度量指标——风险价值(Value-at-Risk,VaR)与期望短缺(Expected Shortfall,ES)的多方法预测组合进行系统研究,致力于通过组合大规模的VaR和ES预测,提高风险预测的准确性与鲁棒性。
- 核心论点和目标:
- 当面对大量多样的VaR和ES预测方法时,单一方法的选择不再最佳,组合这些方法的预测可以充分汲取各种信息,实现“智慧的集体”效应。
- 报告提出并实证检验了一系列新的组合方法,特别针对大规模预测池(90种预测方法),包括统计测度中心趋势(平均、中位数、众数)、基于区间预测组合的修剪均值、概率平均、基于性能的加权组合以及组合组合预测等方法。
- 通过六大股指的实证研究,证实修剪均值、概率平均和性能加权组合表现优异,能够有效提高VaR和ES预测的准确性和稳健性。
---
二、逐节深度解读
1. 引言与背景(Section 1)
- 关键论点:
- VaR是金融机构广泛采用的尾部风险度量,便于理解但对超过阈值的损失信息缺乏揭示。
- ES作为VaR的补充风险指标,尤其在巴塞尔III监管框架中获得推广,提供了更为严格和连贯的风险衡量标准(ES是次可加的风险度量,具有更好的组合投资属性)。
- 近年涌现出大量基于GARCH、量化自回归、实证波动率等不同方法进行的VaR和ES建模预测。
- 面对众多预测模型,选择单一方法存在风险,组合预测(forecast combination)迎合“集体智慧”理念,通过综合不同模型信息降低模型风险。
- 虽然点预测和密度预测组合已有广泛文献,VaR和ES的组合预测研究较少,尽管已有少量相关工作(如Taylor 2020,Wang和Cheng 2022),但对于大规模预测池的研究尚罕见。
- 推理依据:
- 由于VaR和ES预测模型众多且异质,组合预测能整合多种信息,既有理论支持(如集体智慧理论Galton 1907),又方便实现风险分散,规避模型选择风险。
- Fissler和Ziegel(2016)的联合可引出评分函数,使得VaR和ES可联合建模与评估。
2. 扩展与贡献(Section 2)
- 关键论点:
- 研究组合90个不同的VaR和ES预测方法,覆盖从简单的历史模拟到复杂的GARCH、CAViaR及CARE模型,亦包含引入实证波动率、价格区间的多种方法。
- 基于超大规模方法池,设计并引入多种新的组合预测方法,如基于众数的核密度估计、正则化性能加权、区间预测组合方法(修剪均值多样化)等。
- 另外也提出结合多种组合方法的方案(组合组合),如平滑过渡组合(STC)。
- 逻辑与假设:
- 大规模预测池中简单的平均组合难以最优,需引入更灵活的估计,如正则化权重估计避免过拟合。
- 视每个方法的VaR和ES预测为区间边界,借鉴决策分析中区间预测组合理论,进行加权与修剪。
- 结合多种组合方法发挥不同长处,改善集成预测的稳定性和灵活性。
3. 实证数据与个体预测方法(Section 2.1 & 2.3)
- 数据:
- 6只主要股指(日高、低、收价格及5分钟实证方差),共5400天数据,滚动窗口1800天估计,后3600天预测。
- VaR和ES针对2.5%置信水平,逐日生成90个方法对应的VaR和ES预测。
- 个体方法汇总:
- 历史模拟及高斯方法(非参数及参数法)
- EWMA
- 多类GARCH系列(标准、范围替代残差、实证方差嵌入,GJR-GARCH含杠杆效应)
- CAViaR系列(基于Engle和Manganelli 2004;多种ES估计形式)
- CARE模型(基于条件期望量,模仿CAViaR结构)
- 多数方法引入价格区间和实证波动率指标,涵盖参数、半参数及非参数不同范式。
- 关键点说明:
- 确保ES预测不超过VaR预测(ES应在VaR之下),部分方法对VaR与ES间距进行预测组合避免“交叉”。
- 时间序列滚动估计,实时更新模型参数。
4. 组合方法(Section 3)
4.1 非基于历史表现的组合方法(Section 3.1)
- 中心趋势方法:
- 简单平均(无历史表现依赖);
- 中位数,因其对异常值鲁棒性强,但以往VaR/ES少用中位数,现因池大而采用;
- 众数,采用核密度估计(KDE)找最高密度峰值作为组合预测值,同时对VaR-ES间距联合估计,确保非交叉。
- 区间预测组合方法:
- 五类修剪均值(对VaR和ES分别修剪一定数量低或高预测):
- 对称修剪均值(同时去掉高低值)
- 外部修剪均值(去除VA R高端和ES低端,收窄区间宽度)
- 内部修剪均值(去除VaR低端和ES高端,扩大区间宽度)
- 低端修剪均值(剔除过于保守的低值)
- 高端修剪均值(剔除过于激进的高值)
- 灵活修剪均值,两个独立参数实现上述五种模式的通用扩展。
- 概率平均,假设VaR和ES预测构成区间的CDF取自偏态t分布,推断其CDF后对90个CDF做均值,最终断点确定组合VaR和ES,理论上比直接对VaR、ES做均值组合更激进风险估计。
- 半空间中心深度和单纯形深度(bivariate深度,寻找VaR和ES预测对的“核心”点,避免单边异常干扰)。
4.2 基于性能的加权组合方法(Section 3.2)
- 相较非性能基方法,需估计权重,权重依据历史表现得分(采用Fissler和Ziegel 2016的联合评分函数):
- 绝对加权相对分数法(参数λ平衡单均值与极端模型选择,动态调节权重强度);
- 加权中位数结合;
- 轨迹式最低分数法,针对VaR和VaR-ES间距分别估计权重,复杂度升高(178个权重);
- 基于期望短缺比率的新的最低分数法替代模型,借鉴CAViaR模式建模ES与VaR的乘积关系;
- 正则化的最低评分法,引入岭回归形正则项约束权重向等权收敛,防止高维权重过拟合。
- 实证显示,不同模型根据权重表现显著差异,例如简单方法在权重算法中表现相对较低,但在间距预测组合中部分简单方法权重提升。
4.3 组合组合预测(Section 3.3)
- 平滑过渡组合(STC),结合两种组合预测(如简单平均与相对分数加权组合)结果,通过Sigmoid函数调节权重,权重依赖过渡变量(如平均VaR预测,反映波动率),动态适应不同市场状态。
- 简单平均所有混合组合预测的预测结果,体现集成学习哲学。
---
三、图表深度解读
表1:六大股指日收益统计
- 展示指数包括澳大利亚AORD、德国DAX、英国FTSE 100、香港恒生指数、日经指数和标普500。
- 平均收益小(均低于0.02%),波动率从0.946%(AORD)至1.481%(Nikkei)不等。
- 所有指数收益分布均偏负偏斜,峰度均较高,显示极端负向跳水发生频率较实证特征显著,尾部加重。
- 证实VaR和ES的必要性,特别是对下尾风险的关注。
图1(Page 5)
- 内容:展示FTSE 100 3600天的实际收益,以及90个方法分别给出的VaR、ES和其间距预测时间序列。
- 解释:
- VaR和ES预测反映尾部风险水平,整体负值,体现风险大小。
- 多个方法预测有显著差别,尤其在极端市场冲击时刻更明显,体现信息多样性。
- ES始终位于VaR之下,符合定义;间距预测存在动态变化,反映模型间差异。
- 作用:直观揭示90种预测的分布与多样性,体现组合潜力。
图2(Page 9)
- 内容:使用核密度估计分别绘制了90个VaR预测值及间距预测值的密度曲线,点明众数所在位置。
- 解释:
- VaR众数约在-2.46,间距众数约0.70,显示大部分方法在该水平聚集。
- 众数提供不同于均值或中位数的统计视角,可能对异常值更鲁棒。
- 意义:展示众数法的工作机制,作为组合新方法的直观说明。
图3(Page 10)
- 内容:五种修剪平均方法分解示例,描绘最终组合VaR与ES的计算途径。
- 涵义:
- 不同修剪方式对应不同的修剪对象和方向(高端/低端),区间宽度相应不同(收窄或扩展)。
- 图形表现修剪具体步骤及组合结果的变化,便于理解修剪均值方法的本质。
- 附注:为设定修剪参数N的优化提供直观基础。
图4(Page 11)
- 内容:FTSE 100中不同修剪均值方法中修剪参数随时间的动态变化。
- 观察点:
- 对称修剪参数有明显峰值,尤其疫情初期裁剪显著,反映极端风险市场表现影响研发。
- 其他修剪方法如内修剪和低端修剪多数时间修剪参数接近零,说明它们行为类似于简单平均。
- 高端修剪参数呈上升趋势,反映原始预测偏低,没有充分涵盖尾部极端亏损风险。
- 联系:支持理论上组合尾部风险估计偏保守的观点。
图5(Page 12)
- 内容:展示90个方法对应的分布函数(CDF)及概率平均后得到的综合CDF,标示组合VaR和ES位置。
- 解读:
- 综合CDF通过概率平均得到,曲线较各单一CDF平滑且分布更宽,代表了更激进的风险估计。
- 组合VaR和ES对应于5%分位点和期望短缺,实证说明概率平均法实现了从单边量化向分布综合的跃迁。
- 图示直观展示了概率平均的统计学本质。
图6(Page 14)
- 内容:90个方法VaR和ES点的二维散点图,叠加简单平均、中位数和半空间/单纯形深度的组合点位置,并附半空间和单纯形计算示意。
- 见解:
- 半空间及单纯形深度定义的“最深点”不同于简单平均和中位数,提供了一种更为稳健的联合估计。
- 该点对应某个具体个体预测方法的输出,具备解释性和理论基础。
图7 & 图8(Page 15-16)
- 分析:
- 简易历史模拟类方法权重低,显示其预测性能较弱,符合预期。
- GJR-GARCH加权较多,尤其实证波动率方法权重高,表明其在风险估计中贡献更大。
- 低分数法分离了VaR与间距的权重,间距权重中简单方法表现更好,提示简单方法在区间宽度预测上有价值。
图9(Page 18)
- 内容:加正则化的最低得分法权重动态,权重分布更均匀,波动较小。
- 含义:
- 正则化使权重趋向均匀,有效避免过拟合和权重震荡,这在高维权重估计中特别重要。
- 与不正则化权重(图8)相比,稳定性明显提升,有助于组合预测的稳健性。
图10(Page 19)
- 内容:平滑过渡组合(STC)中,简单平均与相对得分加权的权重切换趋势图及对应的VaR和ES预测。
- 解读:
- STC权重随市场波动(以平均VaR作为代理)变化,波动大时权重倾向于性能加权组合,波动小时偏向简单平均。
- 该动态权重体现稳定与灵活的权衡,在实践中适应市场环境变化,提高组合预测的适应性。
表2(Page 8)
- 内容:19种组合方法汇总表,按是否依赖历史准确度、是否适合大规模预测池及新颖性分类。
- 指示:
- 大多数新方法(如多种修剪均值、概率平均、深度结合、正则化的加权组合等)均首次应用于VaR和ES领域。
- 明确提出组合方法的多样性和分层策略,便于后续研究针对具体场景选择合适方法。
表3(Page 20)
- 内容:18种组合方法的四类校准测试(Kupiec、Christoffersen、DQ以及McNeil和Frey的ES校准)在6个指数上的通过情况总结。
- 要点:
- 多数方法在大部分指数均未显著拒绝校准,尤其概率平均、最低分数及其乘比版本表现最佳,体现了校准的严谨性。
- 动态选择基准表现相对一般,组合预测优势显著。
表4(Page 21)
- 内容:五种评分规则所用函数的数学描述,明确其对应的联合评分机制。
- 说明:
- 多个评分规则均为Fissler和Ziegel(2016)评分函数的一类特殊形式。
- 量化评分(QS)只考察VaR,其他规则联合考虑VaR和ES,逐步丰富评估维度。
表5(Page 23)
- 内容:五种评分指标下,各组合方法相对基准方法HS-250的技能分及排名汇总。
- 洞察:
- 所有组合方法均显著优于动态选择基准,验证组合策略的有效性。
- 高修剪均值、概率平均和最低分数组合方法表现突出。
- 灵活修剪均值因参数复杂性未优于部分简单修剪模型。
- 组合所有组合方法简单平均表现也异常抢眼,体现“多样性+集成”效应。
- 半空间与单纯形深度方法表现不及单变量中位数,提示复杂度提升不必然带来性能提升。
表6(Page 24)
- 内容:模型置信集(MCS)测试,检验不同方法是否包含“最优模型”。
- 要点:
- 动态选择多次未被包含,组合方法普遍覆盖或接近最优。
- 提供对多个指标和指数的稳健性支持。
表7(Page 25)
- 内容:缩短训练窗口至900天时组合方法的性能变化。
- 结果:
- 缩短窗口后整体技能分有所提升,且部分复杂的最低分数方法不如相对分数加权优,体现参数估计样本不足导致的复杂方法性能下降。
- 概率平均方法稳定,仍为领先方法之一。
- 组合所有组合预测简单平均依旧表现稳定优良。
---
四、估值分析
本报告未涉及传统意义上的估值(Valuation)分析,而是着重于风险预测准确性提升的统计建模层面,估值相关章节可视为对诸多VaR/ES预测模型的比较和综合。主要“估值”概念体现为:
- 使用联合打分函数(Fissler和Ziegel 2016)进行模型评估和组合权重优化,该评分函数兼顾VaR和ES的统计合理性,可反映预测准确性。
- 修剪均值、概率平均和正则化加权体现的组合风险控制优化思路,属于风险量预测质量的“最优组合”建构,类似投资组合优化理论。
- 正则化方法的采纳防止组合权重过拟合风险,确保组合稳健性,与机器学习中的模型正则化方法理念一致。
---
五、风险因素评估
- 报告未显式列出风险因素章节,但隐含如下风险:
- 模型过拟合风险:尤其是性能加权方法在拥有高维权重参数时,存在过拟合训练数据的风险,作者引入正则化以缓解。
- 参数估计样本依赖性:样本量变化明显影响权重估计稳定性和组合预测的性能,短期内数据不足可能削弱复杂方法效果。
- 模型池多样性风险:若个体预测模型之间过于同质,组合效果受限;反之多样性越高,组合潜力越大。
- 方法假设风险:如概率平均法假设分布为偏态t分布,若实际不符合将影响拟合与预测准确。
- 缓解策略:
- 利用组合预测天然的风险分散优势降低单一模型失败的影响。
- 通过滚动窗口、动态权重调整和平滑过渡组合机制应对市场环境变化。
- 定期检验组合预测的校准性,确保风险指标反映市场真实风险水平。
---
六、批判性视角与细微差别
- 报告提出的多种新颖组合方案,展示出理论上的创新与实证上的有效,但极少考虑实际模型计算复杂度与金融机构实现难度。
- 核密度估计找众数方法,虽然新奇,实际在高维、平滑密度估计参数敏感性可能影响性能,报告缺少对此误差影响的详细讨论。
- 修剪均值法表现优异,但对修剪参数的选择尤为关键,长期稳定性待定。
- 多数方法以滚动窗口估计,存在样本尺寸选择权衡,报告实验固定样本规模,缺乏对不同市场结构波动率水平的适应性分析。
- 概率平均法虽提升了风险极端估计,但过于激进也可能导致资本配置过度保守,报告中未明确讨论此潜在经济影响。
- 性能加权法权重随时间波动大,虽符合动态调整需求,但过度波动可能使得组合预测不稳健。
- 对性能加权中简单法和复杂法表现差异,报告有理性解释,但缺少对异常市场事件期间表现的细节分析。
---
七、结论性综合
本报告全面系统地探讨了将大规模VaR和ES预测方法组合的多种技术路径与应用效果,突破了以往相关文献中对小规模Pool的局限。通过对六大市场指数近15000个交易日的实证研究,得到以下深刻见解:
- 大规模预测组合的优势显著:与挑选单一“最佳”模型相比,组合预测稳定且提升风险预测的准确性,降低了模型选择风险。
- 多种组合技术均有可用价值:
- 高修剪均值与概率平均有效提升尾部风险估计激进度,体现大多数模型偏保守;
- 性能加权组合,特别是最低分数方法,通过细化权重控制表现最佳个体模型的贡献,进一步优化组合;
- 正则化措施增强权重估计稳定性,防止过拟合,适合高维预测环境;
- 平滑过渡组合机制灵活应对波动变化,实现简洁均值与性能权重的动态平衡;
- 组合所有组合方法的简单平均表现稳定,揭示“组合的组合”理念对风险模型的潜力。
- 实证校准测试和各种评分指标均支持组合策略的可靠性,多指数、多评分体系均验证组合模型独具优势。
- 训练样本长度影响复杂方法性能,但组合逻辑稳健,短样本中相对简单方法优势凸显。
- 报告提供了详尽的理论框架、各类算法实施细节(如概率推断流程)、丰富的实验结果及图表说明,具备极好的应用示范价值。
- 从行业视角,该研究鼓励金融机构和监管部门采用多模型组合框架作为风险管理的重要工具,有助于提升资本充足性评估、风险计量和监管合规的科学性和稳定性。
---
引用溯源:本报告所有观点、数据、图表及推断均严格依据原文页面内容,已于段落、章节与页码处注明([page::x]格式标识)。