Elicitability and identifiability of tail risk measures
创建于 更新于
摘要
本报告系统研究尾部分布风险度量的可识别性和可引出性,揭示了尾风险度量与其生成函数之间的紧密联系,并提出了一类加权评分函数,促进尾风险回归拟合和模型验证,特别论证了尾期望值和对应分位数的联合可引出性,实现了风险管理中的模型比较与回测方法创新 [page::0][page::1][page::4][page::5][page::11][page::12][page::21]。
速读内容
- 尾风险度量定义及背景 [page::0][page::1][page::4]:
- 尾风险度量通过损失分布超出某信心水平的部分确定,典型例子包括VaR和ES。
- 任何尾风险度量均可由其生成的风险度量(生成函数)在尾部分布上计算获得。
- 可识别性(Identifiability) 和可引出性(Elicitability) 概念 [page::1][page::3][page::5][page::6]:
- 可识别性定义为风险度量是期望识别函数的唯一零点。
- 可引出性定义为风险度量是期望评分函数的唯一最小点。
- 这两性质有助于统计方法中的Z估计、M估计和广义矩估计,支持模型拟合与验证。
- 主要理论贡献及结果概述 [page::8][page::10][page::11][page::12]:
- 命题4.1和5.1:尾风险度量的可识别性/可引出性传递给其生成函数,反之亦然。
- 定理4.3:若生成函数可识别,则尾风险度量与对应分位数组成的向量可识别。
- 定理5.3:若生成函数可引出且评分函数满足单调性条件,则尾风险度量与对应分位数组成的向量可引出,且给出其严格一致评分函数具体构建方法。

- 评分函数样例与特殊情况 [page::15][page::16][page::17]:
- ES作为期望的尾风险度量,其评分函数对应经典Fissler-Ziegel分数,强调凸函数与加权结构。
- 提出新颖结果证明尾期望值$\tau$-expectile(生成函数)对应的尾风险度量与分位数组合可引出。
- 还涵盖生成函数为期望比值、shortfall风险度量等场景,拓展了尾风险评分函数设计的广泛适用性。
- 尾分布整体的可引出评分规则[page::18][page::19]:
- 定义整条尾分布的proper scoring rule,且介绍CRPS及其加权变体作为主要实例。
- 创新提出基于尾分布分位数的加权CRPS严格proper评分规则,有助于尾部分布预测性能的评估。

- 左尾及区间分布风险度量的推广 [page::19][page::20]:
- 结果对左尾和区间分布风险度量做对称推广,涉及对应的生成函数和评分函数构造。
- 例如区间VaR的相应评分函数具有分段线性性质,适合描述和拟合区间风险。
- 理论和应用意义总结 [page::21]:
- 证明了尾风险度量与其生成函数在可识别性和可引出性上的等价关系,解决了尾风险模型拟合和后验评价的核心理论难题。
- 提示了基于已知生成函数构建尾风险度量评分函数的明确方法,便于风险管理中的统计建模与回测。
深度阅读
资深金融分析师对研究报告《Elicitability and identifiability of tail risk measures》的全面解析
---
1. 元数据与报告概览
- 报告标题:Elicitability and identifiability of tail risk measures
- 作者:Tobias Fissler,Fangda Liu,Ruodu Wang,Linxiao Wei
- 发布日期:2024年7月2日
- 主题:该报告从统计学和金融风险管理的角度,深入探讨了尾部风险度量(tail risk measures)的“可引出性”(elicitability)和“可识别性”(identifiability)特性,重点涉及Value-at-Risk(VaR)和Expected Shortfall(ES)等重要风险指标的特性及相关数学性质。
核心论点:报告建立了尾部风险度量及其对应分位数(quantile)联合的可识别性和可引出性理论,条件是它们的生成器(generator,即诱导的法则基础风险度量)本身具有这两种性质。展示了尾部期望值(tail expectile)与相应分位数的联合可识别性和可引出性,并构造了一组新颖的加权评分函数(weighted scores),包括之前研究中由Fissler和Ziegel提出用于ES的评分函数作为特例。
报告意图:该工作不仅在理论上推进尾部风险度量统计性质的系统研究,还为实际风险模型的拟合、比较、验证(如回测)提供理论工具,具有良好的应用前景。
---
2. 逐节深度解读
2.1 引言(第0-1页)
- 关键论点
- 近年来,尾部风险度量,尤其是VaR和ES,成为银行和保险监管(Basel III/IV,Solvency II)的核心风险衡量指标。
- 尾部风险度量基于对损失分布的特定分位以上尾部的描述。此领域已有多种扩展风险度量出现,如尾部标准差、尾部熵风险度量、Glue VaR、Gini Shortfall、Range VaR等。
- 可识别性与可引出性是统计和风险管理中用于风险度量精确估计和回测的关键性质。可识别性指南用标识函数来唯一确定风险度量的值,可引出性则基于唯一最小化某种评分函数来定义。
- 先前研究表明,平均值、VaR和ES的组合是同时可引出的。该报告将系统研究尾部风险度量与其生成器之间的可识别性与可引出性关系。
- 主结果包括两个重要定理(4.3和5.3),关于尾部风险度量及分位数的联合可识别性和可引出性,相关的评分函数和识别函数明确构造。
支撑逻辑
- 利用生成器风险度量的性质,推导尾部风险度量的特性,突破传统只针对单一风险度量的刻画。
- 理论支持风险度量的统计估计和回测,从而使风险管理操作更严谨。
2.2 预备知识(第2-4页)
主要介绍基本概率空间设置、分布类定义、风险度量的基本性质及定义:
- 尾部风险度量定义:
- 刻画位于某一分位点$p$之后的尾部分布$Fp$,利用生成器风险度量$\rho^$计算尾部风险度量$\rho(F)=\rho^(Fp)$。
- 反向,也可由生成器指定来定义尾部风险度量。
- VaR和ES的定义及性质:
- VaR区分右分位数$\mathrm{VaR}p^+$(分布大于$p$的最小点)和左分位数$\mathrm{VaR}p^-$(分布至少达到$p$的最小点)。
- ES定义为尾部平均VaR的积分。
2.3 定义“可引出性”和“可识别性”(第5-7页)
- 定义3.1 / 3.2:详细介绍了功能性(functional)$T$的识别函数和评分函数的定义,严格映射到统计学中的Z估计、M估计和回归模型。
- 举例:
- 均值是可引出的,反映平方损失的评分函数,识别函数为误差$(x-y)$。
- 分位数是可引出的,识别函数为指标函数$\mathbb{1}{\{y \le x\}}-p$。
- ES本身不可单独引出,但$(Qp, \mathrm{ES}p)$联合可引出和可识别。
- 凸水平集(CxLS)性质:作为可引出性和可识别性的必要条件,函数级别集的凸性保证模型参数的稳定性。
逻辑严密性强,定义全面,为后续章节结果奠定基础。
2.4 可识别性结果(第8-11页)
- 命题4.1(尾部风险度量$\rho$与生成器$\rho^$的可识别性关系)指出:
- 如果尾部风险度量$\rho$具有严格识别函数$V$,则其生成器的严格识别函数可由$V$构造而来,公式为$Vr^(x,y)=(1-p)V(x,y)+pV(x,r)$,体现了尾部分布和分位点权重的混合。
- 类似地,对于$(Qp, \rho)$的联合识别函数,由生成器识别函数$V$进行针对性构造。
- 定理4.3(逆方向):若生成器$\rho^$可识别,$(Qp, \rho)$的联合识别函数可显式给出。
- 识别函数结构复杂,含有基于$V^$的分段加权构成,保证联合唯一性。
- 典型实例:以ES及其生成器均值为例,识别函数匹配经典文献。
- 推论4.6:由可识别性蕴涵凸水平集性质,确保分析数学结构完备。
2.5 可引出性结果(第11-15页)
- 命题5.1:与命题4.1类似,给出可引出性的传递性质:
- $\rho$的严格一致评分函数$S$可以构建生成器$\rho^$的严格一致评分函数$Sr^(x,y)=(1-p)S(x,y)+pS(x,r)$,满足可引出性。
- 联合可引出性情况下$(Qp, \rho)$的评分函数映射有所区别,反映了联合结构更复杂的评分函数形式。
- 定理5.3:核心结果:
- (i) $\rho$对$Qp$条件可引出,即已知分位数的情况下$\rho$的预测可以借助对应生成器的评分函数构造。
- (ii) 若生成器的评分函数$S^(x,y)$对$y$严格单调递增,则$(Qp, \rho)$整体可引出,有严格一致评分函数,显式表达为分位函数分段加权组合。
- (iii) 在技术假设下,一切严格评分函数必定能转化为上述形式,具有完全刻画力。
- 重要技巧:
- 引入了“修正项”(correction term)$\left(\mathbb{1}{\{y\leqslant v\}} - p\right)S^{}(x,v)$,确保联合评分函数的严格一致性及模型收敛。
- 使用Osband原理严密证明。
- 讨论了评分函数在部分单调性上的技术条件及其变化(Lemma 5.5)。
- 实用例子:
- 期望-ES对(相关于生成器的期望)
- $\tau$-尾部期望(tail expectile)及其生成器均通过该理论在统计上可引出
- 期望的比率函数(ratio of expectations)等多种生成器均符合该框架。
2.6 特殊部分及扩展(第15-21页)
- 尾部分布的全貌引出:提出概率预测的proper scoring rules(如CRPS)在尾部分布$F
- 透彻地将上述理论迁移至左尾分布及分布区间主体,构造对应的尾部风险度量和联合评分函数,给出一致性条件,保证理论的广泛适用性。
- Section 6详述了相关结构,与右尾对应的严格递减条件互为镜像。
2.7 结论(第21页)
总结主要发现:
- 尾部风险度量的可识别性与可引出性与其生成器的性质密切相关,互为充分必要条件(在一定假设下)。
- 体系化构造了其对应的识别函数和评分函数,拓展了以往只针对ES的有限理论。
- 研究为风险度量模型的拟合与风险指标的回测、检验奠定了坚实的统计学基础。
- 开放性问题包括:中间区间风险度量的引出特性、完整表征所有生成器的可引出性、以及尾部风险的“elicitation complexity”(统计特性复杂度)等。
---
3. 图表与公式深度解读
本报告未包含传统意义上的图表或数据表,以数学公式、定义和定理构成主要信息载体。以下对这些数学结构进行详解:
3.1 定义与公式的注释
- 尾分布定义(第4页公式):
\[
Fp(x) = \frac{(F(x)-p)+}{1-p}, \quad x\in\mathbb{R}
\]
表示基于原始损失分布$F$,截取$ p $分位点以上的尾部,重新归一化为概率分布。
- 尾部风险度量生成器定义:
\[
\rho(F) = \rho^(Fp)
\]
即尾部风险度量$\rho$被唯一确定为对尾部分布$Fp$应用某生成器风险度量$\rho^$的结果。
- 可识别函数与评分函数的严格定义(第5页):
通过积分形式的方程和最小化评分函数定义了风险度量的严格识别或引出条件,关键体现在方程式:
\[
\int V(x,y)dF(y)=0, \quad
\arg\minx \int S(x,y)dF(y) = T(F)
\]
- VaR的两种定义:
- 右分位数:
\[
\mathrm{VaR}p^{+}(F) = \inf\{x: F(x) > p\}
\]
- 左分位数:
\[
\mathrm{VaR}p^{-}(F) = \inf\{x: F(x) \ge p\}
\]
- ES定义:
\[
\mathrm{ES}p(F) = \frac{1}{1-p}\intp^1 \mathrm{VaR}r^{+}(F) dr
\]
- 联合识别函数关键构造(第10页定理4.3):
\[
V(v,x,y) = \begin{pmatrix} \mathbb{1}{\{y \le v\}} - p \\ \mathbb{1}{\{y > v\}} V^(x,y) + (\mathbb{1}{\{y \le v\}} - p)V^(x,v) \end{pmatrix}
\]
把生成器的可识别函数$V^$和分位数识别函数组合起来,针对尾分布的不同区间对参数做加权。
- 联合一致评分函数构造(第12页定理5.3( ii)):
\[
S(v,x,y) = \mathbb{1}{\{y > v\}} S^(x,y) + (\mathbb{1}{\{y \le v\}} - p) S^(x,v) + a(y)
\]
其中$a(y)$为可积函数,$S^$是生成器对应的评分函数。此构造保证$(Qp, \rho)$联合评分满足严一致性。
这同时是加权评分函数,又引入了依赖于预测值的权重阈值$v$,拓展了原Holzmann和Klar(2017)加权评分理论。
3.2 评分函数单调性及扩展(第14页)
- Lemma 5.5探索了评分函数在其观测值参数上的单调性及等价条件,确保评分函数构造的合理性与统计优良性质。
3.3 特殊案例解释(第15-17页)
- $\tau$-尾部期望(tail expectile)作为生成器的尾部风险度量,评分函数构造和单调性条件得到满足,首次证明其尾部版本的联合可引出性。
- 短期风险度量(shortfall risk measures)通过适当的损失函数定义,满足识别函数条件,评分函数可构造,理论涵盖面广。
- CoVaR风险度量的回测表现无法借助本报告的理论直接实现可引出性,因其观测数据为多维,限制了理论适用范围。
3.4 对左尾和分布体中区间的推广(第19-21页)
- 明确左尾尾部风险度量的定义及相似理论备述。
- 体部分布区间的风险度量通过双分位数定义,并构造相关一致评分函数,具备同样的理论性质。
---
4. 估值分析
该论文属于理论数学与统计学领域,主要研究风险度量方法的统计性质,不涉及具体金融资产或企业的估值计算,因此不存在传统意义上的估值分析、目标价或市盈率等指标。
不过,可理解为:
- 尾部风险度量$\rho$由生成器$\rho^*$估计传导,即评价金融机构资产尾部风险的核心指标,其准确性和一致性保证对于风险资本的合理估算、监管资本充足性计算极为关键。
- 论文工具辅助估值准确性提升,通过可引出性与可识别性的证实,帮助构造基于分布尾部风险的统计估计方法,从数据反推风险水平的估值更为可靠。
---
5. 风险因素评估
论文虽未直指外部风险因素,但隐含涉及的风险点包括:
- 分布假设限制:部分定理依赖分布连续、密度存在、尾部分布归一化等条件,实际金融损失分布可能存在跳跃、不连续,影响识别函数、评分函数的构造有效性。
- 生成器限制:生成器风险度量需满足可引出性和可识别性,若实际生成器或尾部风险度量不符合(如部分非单调、非凸函数情形),理论结果难以成立。
- 多维观测限制:CoVaR等多变量风险度量案例未包含在该理论框架内,突出单变量风险度量方法的适用局限。
- 技术假设密集:部分定理需严格满足数学可微性、积分收敛性、函数单调性等条件,一旦偏离,理论结论的不确定性增大。
- 评分函数单调性假设:强制要求评分函数对应参数对观测变量严格单调,且需支持某种修正(补偿函数)以达到合适的统计性质,该假设具有一定的模型挑选风险。
论文在附录B明确列出一系列严苛假设,这些技术性条件是理论严谨的关键,也限制实际推广的广度。
---
6. 审慎视角与细微差别
- 理论构建的高数学抽象层面:依赖生成器风险度量的“可识别性”和“可引出性”一系列严格定义,对于实操风险度量具有一定的理论前置门槛。
- 生成器可引出性基础假设的关键性:理论表明生成器的可引出性是尾部风险度量联合可引出性的必要与充分条件,但现实中生成器的选取与建模存在不确定性,可能影响理论的适用性。
- 评分函数的构造存在非唯一性:同一风险度量对应评分函数存在强等价类,且不同评分函数的单调性可能不一致,实际应用需慎重选择具体评分函数。
- 分位数的识别函数仅在特定集合定义有效:如分位数的识别函数在$\mathcal{M}_{(p)}$上严格成立,但在更大类集上不可用,影响识别函数方法的普遍性。
- 理论结果主要针对单变量尾部风险度量,多维风险度量的案例(如CoVaR)无法通过该方法论轻易解决,暗示未来研究空间。
- 实际操作中评分函数的“修正项”需合理解释:理论上增加了分段加权及修正补偿项,实操时需保证该项合理估计,否则评分一致性可能失效。
---
7. 结论性综合
本论文聚焦于尾部风险度量的核心统计性质“可引出性”和“可识别性”,这是风险管理模型估计和回测的数学基础。其主要贡献包括:
- 明确揭示了尾部风险度量与其生成器风险度量之间在可引出性和可识别性上的等价关系,该双向关联丰富并统一了风险度量统计学的理论体系。
- 创新性地构造了一类包括已知ES与分位数评分函数的加权评分函数族,引入基于预测值依赖的阈值权重机制,极大扩展了风险度量的统计工具箱。
- 实证及理论验证了多类典型生成器(均值、$\tau$-期望、比值类期望、短期风险度量等)所诱导的尾部风险度量均满足联合可引出性,为风险模型估计技术的推广奠基。
- 讨论延伸至左尾风险度量及分布主体区间部分的风险度量,增强理论实用性和全面性。
- 在“开头-生成器-尾部风险度量-联合可引出性”逻辑闭环的指引下,促使风险模型估计方法(包括Z-估计、M-估计、Generalized Method of Moments、回归与机器学习算法等)在尾部风险管理中更具可操作性和可靠性。
- 提出严苛的数学假设及技术条件,这既保证了结论的严谨,也提醒后续研究者注意实际分布和评分函数构造的适用范围和限制。
- 为监管和风险管理实务提供理论保证,有助于改进监管资本的风险度量模型、提高风险模型回测和验证的有效性,提升金融体系稳健性。
---
总结
该报告为尾部风险度量理论研究提供了一套系统性的统计学工具,连接风险度量本身与其构成生成器的可识别性与可引出性属性。通过数学严谨的定理及构造,不仅推动了风险度量理论的发展,也为实践中的风险估计和模型验证带来新的可能。在未来实务落地时,也需尊重报告中提出的各种分布限制和评分函数构造条件,确保模型统计有效性。