`

Gerber统计法:估计投资组合协方差矩阵的新方法

创建于 更新于

摘要

报告介绍了Gerber统计法,这是一种基于扩展Kendall's Tau的稳健协方差矩阵估计方法,能有效忽略小幅波动和极端值。实证涵盖9类多样化资产,显示Gerber方法优于传统历史协方差矩阵和Ledoit-Wolf收缩法,提升了投资组合的累计收益率和夏普比率,有助于更稳健地构建资产配置。[page::0][page::2][page::5][page::12][page::17]

速读内容


Gerber统计法简介及理论优势 [page::2][page::3][page::4]

  • Gerber统计量通过阈值过滤小幅波动,统计同向和反向大幅波动出现的频率,形成稳健的共动性度量。

- 其扩展自Kendall's Tau,具备对极端值不敏感、剔除噪音影响的特点,不依赖样本协方差矩阵输入。
  • 公式核心为统计资产对在超过阈值区域(U/D/N)的同时出现频率,并构造Gerber矩阵用于协方差估计。


数据与对照方法 [page::8][page::9][page::10]

  • 使用1988年至2020年间的9类全球主要资产月度总回报数据,包含股票、债券、房地产、商品等。

- 对照方法包括传统历史协方差矩阵(HC)与Ledoit-Wolf(2004)收缩估计法(SM)。
  • 投资组合均值-方差优化框架下基于24个月滚动窗口计算预期收益和协方差矩阵,月度调仓,考虑交易成本。


Gerber统计法实证表现(临界值c=0.5) [page::12][page::13]




| 风险目标 | HC终值($) | SM终值($) | GS终值($) |
|---------|----------|----------|----------|
| 3% | 561,276 | 570,162 | 564,973 |
| 6% | 1,020,100| 1,058,096| 1,138,042|
| 9% | 1,356,911| 1,497,204| 1,639,090|
| 12% | 1,364,148| 1,584,491| 1,695,256|
| 15% | 1,551,339| 1,622,591| 1,779,756|
  • 在风险收益权衡及累计收益上,Gerber统计法普遍优于HC和SM,尤其于9%-15%风险目标范围表现明显。

- Gerber统计法在换手率、偏度和峰度与对照方法相近的情况下,实现更高几何收益率和夏普比率。

Gerber统计法实证表现(临界值c=0.7和c=0.9) [page::14][page::15][page::16]






  • 作为阈值c改变,Gerber统计法依然在各风险水平上优于HC和SM,累计回报与夏普比率表现更佳。

- 表7数据显示不同阈值对收益率和风险指标的敏感度较低,方法鲁棒性强。

Gerber统计法的投资组合性能指标汇总 [page::16]


| 风险目标 | 指标 | HC | SM | GS |
|------------|--------------|------|------|------|
| Ultra-Conservative (3%) | 几何收益率(%) | 6.72 | 5.78 | 5.74 |
| Conservative (6%) | 几何收益率(%) | 7.78 | 7.91 | 8.16 |
| Moderate (9%) | 几何收益率(%) | 8.78 | 9.12 | 9.44 |
| Aggressive (12%) | 夏普比率 | 0.44 | 0.47 | 0.49 |
| Ultra-aggressive (15%) | 换手率 | 4.46 | 4.33 | 4.23 |

Gerber统计法核心优势及未来趋势 [page::16][page::17]

  • 减少噪声数据对协方差估计的影响,剔除非实质性波动导致的误差。

- 不依赖矩阵估计,可结合多维金融信号设计复杂的基于规则的共动体系。
  • 未来工作计划优化标准差测度,拓展多数据集融合的协动测量框架。


深度阅读

Gerber统计法:估计投资组合协方差矩阵的新方法 —— 国泰君安证券研究报告详尽解析



---

1. 元数据与报告概览



报告标题: Gerber统计法:估计投资组合协方差矩阵的新方法
作者及机构: 刘凯至,国泰君安证券研究所(登记编号 S0880522110002)
发布日期: 2024年(具体日期未标明)
研究主题: 新型稳健估计投资组合协方差矩阵的方法 — Gerber统计法,及其在资产配置中的应用和性能对比。

本报告基于Gerber等(2021年)发表的论文,系统介绍并评述了Gerber统计法,这是一种基于扩展Kendall's Tau的稳健协动测量方法。相比于传统历史协方差矩阵和Ledoit-Wolf(2004)收缩法,Gerber统计法在资产配置的实证回测中展现了更高的累计收益率和夏普比率,体现了该方法在面临金融时间序列中极端值和噪声时的独特优势。报告对该方法公式、理论基础、实证数据、估值框架均有详尽介绍,且配备丰富图表以支持结论,最后也指出量化模型存在失效风险[page::0,2,17]。

---

2. 逐节深度解读



2.1 文献概述与引言(第1-2节)


  • 核心论点: 现代投资组合理论始于Markowitz(1952),协方差矩阵估计的精确性直接影响资产配置效果。传统的样本协方差矩阵和Ledoit-Wolf收缩法常受极端值与噪声的影响,不够稳健。Gerber统计法通过引入协方差估计中的国产值(门槛)概念,忽略小幅度噪声和异常极端值,专注于实质性的共动性,因此在稳健性和实际投资组合优化表现上优于传统方法。
  • 方法论: Gerber统计量扩展自Kendall's Tau,通过界定收益率的上限和下限“国产值” $Hk$,只计算超过这些门槛的同步运动次数,避免了对极端水平和噪声数据的敏感,从而提升了协方差矩阵的准确估计能力。该方法并不依赖传统的样本协方差矩阵输入,具有独特的统计稳健性[page::2-3]。


2.2 Gerber统计法的数学公式(第3节)


  • 基本概念与公式(3.1节):

- 给定证券收益率 $r
{tk}$,定义门槛值 $Hk = c \cdot sk$,其中 $c$ 为用户设定的阈值(如0.5、0.7、0.9),$sk$ 是收益标准差。
- 统计量 $m
{ij}(t)$ 根据两个资产在某时点收益是否超过正负门槛,赋值为 +1(同向突破),-1(反向突破),或0(至少一方未突破)。
- Gerber统计量 $g{ij}$ 是所有时间样本中 $m{ij}(t)$ 的加权平均,等价表述为资产对一致突破次数与不一致突破次数之差与和的比值。
  • Gerber矩阵及协方差的构建(3.2节):

- 构造矩阵 $U$ 和 $D$,分别标记各资产在时间序列中超过正负门槛的情况,计算一致(${N}{CONC}$)和不一致(${N}{DISC}$)突破对数矩阵。
- Gerber矩阵 $\pmb{G}$ 定义为 $(N{CONC} - N{DISC}) \oslash (N{CONC} + N{DISC})$,其中 $\oslash$ 为元素对应除法。
- Gerber协方差矩阵 $\Sigma{GS}$ 通过历史波动率矩阵对Gerber矩阵进行加权得到,即 $\Sigma{GS} = \mathrm{diag}(\sigma) \cdot \pmb{G} \cdot \mathrm{diag}(\sigma)$。
  • 半正定修正与表述:

- 实际应用中,直接计算得到的协方差矩阵可能非半正定,经过公式修正后得到的Gerber矩阵相应的协方差矩阵保证半正定。
- 该矩阵公式还支持将资产收益划分为三个状态(UP、NEUTRAL、DOWN),提供9个状态组合计数以更精确衡量资产间的共动行为。
  • Gerber统计与传统相关系数的区别:

- Pearson相关系数基于全部数据点的乘积矩,容易被噪声小变动影响;
- Gerber统计量只衡量实质性超过阈值的同步变动,剔除了噪声数据,从而更具稳健性。
- 此外,Gerber统计法无需矩估计,支持更稳健的波动率估计扩展,未来有望实现完全自由算法[page::3-6]。

2.3 Gerber统计量示例与图解(第3.3节)


  • 案例说明:

- 通过图1展示了S&P500与黄金2019-2020年间24个月度收益对在不同阈值 \( c = 0.5, 0.7, 0.9 \) 下的分布。
- 蓝色散点表示月度配对收益,绿色区域为一致方向(UU、DD),红色为不一致(UD、DU),中性区域(NN)被排除。
- 三个阈值下计算出的Gerber统计值分别约为0.286、0.166和0.154,均不同于二者的Pearson相关系数0.22,显著解释了Gerber统计数据过滤噪声的机制。

图1说明了随着阈值增加,涉及的噪声数据减少,Gerber统计量更具稳健性。不同阈值调整了数据的敏感度,为实际应用提供参数灵活度[page::7-8]。

2.4 实证研究设计(第4节)


  • 数据集介绍(4.1节)

- 选用1988年1月至2020年12月9种资产的月度总回报数据,涵盖美国大盘(S&P500)、小盘股(Russell 2000)、发达和新兴市场股票指数、债券指数、高收益债、房地产信托(REITs)、黄金、商品指数等,样本量为396个月(实际回测1990-2020年)。数据源为彭博终端。
- 资产多样性确保协方差结构具备代表性,相关矩阵热图(图2)显示预期中资产间相关适中但并无强烈结构。
  • 对照方法介绍(4.2节)

- 对比采用:
1. 历史协方差矩阵(HC);
2. Ledoit-Wolf(2004)收缩估计法(SM);
3. Gerber统计法(GS)。
- Ledoit-Wolf方法通过引入收缩常数 \(\delta\),在样本协方差与结构性目标矩阵间折中优化,减轻估计误差。Gerber统计法概念上不同于基于矩的估计,强调基于规则的共动数计数,未来可扩展至多数据维度。
  • 投资组合优化框架(4.3节)

- 均值-方差优化(MVO)框架下,通过二次规划最大化预期收益减交易成本惩罚,权重非负无空头限制。
- 投资组合的预期收益用过去24个月收益均值估计,协方差矩阵分别采用上述三种估计。
- 回测采用滚动窗口方法,每月初重新估计参数并构造最优组合,持有期1个月。风险目标固定,交易成本设为10基点。

2.5 经验结果分析(第5节)


  • 不同阈值\(c=0.5, 0.7, 0.9\)下的对比:


以年化收益率对比图和累计收益率柱状图体现,Gerber统计法(GS)在不同风险目标(3%、6%、9%、12%、15%波动率)下,均取得优于历史协方差法(HC)和收缩法(SM)的表现。具体点包括:

- 在\(c=0.5\)下(图3、4,表3):
- GS明显在大部分风险水平超过HC和SM,除极端保守3%风险外,表现稳定居优。
- 风险收益情况(几何年化收益率、夏普比率)超越两者,换手率、偏度、峰度等指标维持相似。
- 在9%风险水平,GS年化几何收益较SM高32基点,累计收益率提高约10%。

- 在\(c=0.7\)下(图5、6,表4):
- GS优势更明显且持续,所有风险目标均胜出HC和SM。
- 12%风险水平下平均年化收益较SM多41基点,累计回报额外提升逾13%。
- 与较低阈值相比,表现尚有提升,说明增加阈值去噪效果良好。

- 在\(c=0.9\)下(图7、8,表5):
- GS依然保持领先地位。
- 较低风险水平(3%、6%)年几何回报分别比SM高30+个及35+个基点,累积收益率分别多12.11%和11.67%。
- 各风险指标(峰度、偏度、最大回撤、VaR)与其它方法相近,风险得到有效控制。
  • 综合评价(表6、7)

- GS与阈值\(c\)的选择敏感性体现在收益率与风险偏好间的权衡,整体上阈值调整强化了方法的稳定性和优越性。
- GS的换手率处于合理范围,未因收益提升而导致较高交易成本。
  • 实证结论: Gerber统计法显著提升投资组合优化的净表现,在累计回报、风险调整收益率、波动性管理等关键绩效指标上持续优于标杆方法,验证了该稳健协动测度的实用价值[page::8-16]。


2.6 未来工作展望(第6节)


  • 继续优化Gerber统计法使之完全摆脱传统矩估计依赖,采用更稳健的波动性度量替代现有标准差计算。

- 基于Gerber统计法的规则框架,扩展为多维金融信号的共动计算,允许灵活结合收益、成交量、隐含波动率等多种数据,增强协动性测度的现实解释力和实施范围[page::16]。

2.7 报告结论与风险提示(第7、8节)


  • 总结: Gerber统计法通过忽略微小噪声变化及极端波动,有效捕捉实质共动性,提升协方差估计稳健性。实证表明,其在Markowitz均值方差框架下优于历史协方差和Ledoit-Wolf收缩法,具有良好的计算简便性和实用意义。作者期望该方法成为主流替代工具之一。

- 风险提示: 依赖历史数据和量化模型,存在模型失效风险,投资者应警惕样本外的表现差异[page::17-18]。

---

3. 图表深度解读



图1(页面7)


  • 描述: 分别展示阈值$c=0.5,0.7,0.9$下S&P500与黄金收益配对的9个收益状态区域散点图,绿色为“同向”突变区,红色为“反向”突变区,灰色为中性区,蓝点表示配对月度收益。

- 解读: 随着阈值增加,中性区域(NN)数据增多,Gerber统计量在剔除这些“噪声”点后更稳健。三个不同$\mathrm{c}$对应的Gerber值依次减小(0.286→0.166→0.154),均不同于Pearson相关系数0.22。此过程体现Gerber统计量的本质是集中关注“重要”收益变动,共动性测度更精确。
  • 文本联系: 本图阐述了Gerber统计法过滤小幅波动数据以排除噪音的操作机制和参数调整效果,支持计算公式解释[page::7]。


图2(页面9)


  • 描述: 9资产月度总回报相关矩阵热图,主对角自然为1,非对角值介于-0.03至0.82之间。

- 解读: 显示资产之间普遍具有适度正相关,金融资产间存在一定的多样性和分散性。较低甚至负相关(如黄金对S&P500微负)说明多元组合潜力。
  • 文本联系: 该图验证数据集资产成分的多样性基础,为后续协方差构建和组合优化提供合理的前提环境[page::9]。


图3 & 图5 & 图7 (页面12、14、15)


  • 描述: 三图依次展示三个阈值下,不同风险目标水平(年化波动率4%至16%)对应的投资组合年化收益率折线图,比较HC(蓝)、SM(棕)、GS(红)。

- 解读: GS曲线整体高于HC和SM,且随着风险目标增加,表现差距有所扩大,体现GS方法在较高风险承受下更具超额收益能力。三阈值间GS表现依旧强势,且存在细微差别。
  • 文本联系: 强化了Gerber统计法在不同风险容忍度下均优于传统协方差估计的实证结论[page::12,14,15]。


图4 & 图6 & 图8 (页面13、14、15)


  • 描述: 同三个阈值条件下的累计收益柱状图,对比HC、SM、GS五个风险目标的最终投资组合价值。

- 解读: GS组合账户价值显著高于HC和SM,尤其在中等及高风险目标处,增加幅度最高达10%以上,说明长期持有GS权重组合带来更高财富积累。
  • 文本联系: 体现投资组合优化效果在财富积累维度上的实证优势,支撑业绩更优的声明[page::13,14,15]。


表3、4、5 & 6、7(页面13、14、16)


  • 描述: 表3-5提供不同风险目标和阈值下投资组合的账户最终市值数字;表6给出多种风险收益相关指标:算术收益、几何收益、累计收益、年化标准差、偏度、峰度、最大回撤、95%VaR、夏普比率和换手率;表7为GS方法对阈值$c$敏感性分析。

- 解读:
- GS在绝大多数关键指标(投资回报、夏普率)方面均优于HC和SM,风险指标(偏度、峰度、最大回撤、VaR)保持合理范围,未显著恶化风险特征。
- 换手率适中,表明策略交易成本可控。
- 阈值敏感性表明,中值$c=0.7$到$0.9$调整能提升稳健性和回报平衡。
  • 文本联系: 详细验证了Gerber统计法在多维性能指标上对标方法的领导地位,证实其兼顾收益与风险,同时展现方法调参潜力[page::13-16]。


---

4. 估值方法分析



本报告重点不在企业估值,而是在投资组合优化中的协方差矩阵估计方法比较。评估方法基于Markowitz均值-方差优化框架,协方差矩阵作为关键输入量,决定组合的风险调整表现。三种方法的差异主要在于协方差矩阵的估计与稳健性:传统历史矩阵(HC)、Ledoit-Wolf收缩矩阵(SM)与Gerber统计矩阵(GS)。Ledoit-Wolf收缩利用目标结构矩阵和历史矩阵的凸组合,优化估计误差;Gerber统计法则以非矩估计的计数方式衡量实质共动,避免极端异常值和噪声影响,两者从根本路径异。本文通过滚动窗口回测明确了GS方法成本与收益的平衡最优,实现了实际投资组合的性能领先[page::9-13]。

---

5. 风险因素评估


  • 模型风险及历史数据依赖: 结果基于历史回报和量化模型,其有效性可能在样本外受限,存在潜在失效风险。

- 参数选择敏感性: 阈值 \(c\) 的选择影响噪声过滤强度,较极端参数可能低估共动或忽视部分信息。
  • 市场环境变化: 统计特点和金融市场结构的变化可能影响Gerber统计法的适用度。

- 交易成本假设简化: 统一0.1%交易成本设定简化,现实中可能导致表现波动。

报告虽指出量化模型失效风险,但未深入讨论缓解策略,提示投资者关注动态调整和风险管理[page::0,17-18]。

---

6. 批判性视角与细微差别


  • 报告强调Gerber统计法的稳健性和优越性,然而对于极高频交易环境及非正态分布收益的适应性未展开,有待进一步实证验证。

- 虽说明将来计划使用更稳健的波动率测度替代标准差,但当前模型依赖传统标准差,可能影响最终稳健性。
  • Gerber统计法基于门槛计数,可能忽视部分小幅波动提供的有效信息,平衡噪声与信号的最佳参数仍需市场实验调优。

- 表示GS方法可扩展多数据集共动框架,尚无具体实现细节,未来发展方向较为宏观。
  • 报告结构清晰,但个别数学表达、段落衔接略显冗长,可能增加读者理解门槛。


综上,报告稳健、客观,但新方法的实际应用推广仍需关注参数优化与模型适用边界[page::3-6,16].

---

7. 结论性综合



本报告详尽介绍了Gerber统计法,这是一种稳健的投资组合协方差矩阵估计方法,通过扩展Kendall's Tau,采用阈值机制剔除小噪声和极端异常变动,实现对资产收益序列实质共动的精准测度。相较于传统样本协方差矩阵和Ledoit-Wolf收缩法,Gerber统计法不依赖于样本矩估计,从根本上减少非稳健因素的影响。

实证部分通过1988-2020年9种多样化资产的月度数据,采用卧滚动窗口的均值方差优化框架比较协方差估计效果。在多风险目标、不同阈值\(c=0.5,0.7,0.9\)设定下,Gerber统计法均显著优于对照方法,具体表现为:
  • 投资组合年化收益率、累计收益率明显提升,差异在中高风险目标尤为突出,收益提升达数十个基点至10%以上累积金额增幅。

- 夏普比率、几何年化收益率等风险调整后绩效指标持续领先。
  • 换手率、风险峰度、偏度及最大回撤等风险指标与传统方法相近,风险可控。

- 不同阈值调节模型噪声过滤强度,提供灵活调参空间。

图表深度解读明确支撑数据说明Gerber统计法能有效剔除无关噪声,专注于金融资产实质波动的共同表现,反映其统计意义上的稳健性。此外,报告指出未来将优化波动率估计,发展跨多金融数据集的规制规则共动系统,展现出方法的扩展与实际应用潜力。风险提示强调量化模型固有的不确定性,提醒投资者关注样本外表现与模型稳健性。

整体而言,Gerber统计法代表投资组合风险估计领域一种有价值的创新,凭借稳健性和优越的投资表现,有望成为传统历史协方差及Ledoit-Wolf收缩法的重要补充和替代工具。报告详实严谨,理论与实践结合紧密,为复杂市场环境下的资产配置提供了强有力的量化工具支持。

---

溯源引用



[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18]

---

注: 本报告严格依据文中论述、数据与图表进行解释,无主观推断,保持专业与客观。

报告