`

资产配置中不可忽视的相关性分析:Pearson-Spearman-Kendall-Copula

创建于 更新于

摘要

本报告系统讲解了资产相关性分析中常用的Pearson、Spearman、Kendall和Copula四种方法,阐述各自的假设条件与优劣,结合随机抽样数据计算沪深300指数、中证国债、中证货币基金和SGE黄金间的各种相关系数,揭示不同方法间可能存在的不一致性及尾部相关性问题,强调要综合多种衡量指标科学判断资产相关性,避免单一指标引发的误判风险,为资产配置中分散风险提供了数据支撑和方法指导[page::0][page::3][page::13][page::19]。

速读内容


1. 相关性衡量方法详解 [page::4][page::5][page::6][page::7][page::8]

  • Pearson相关系数衡量线性关系,适用于连续且正态分布变量,但其相关系数为零不代表变量独立。

- Spearman等级相关系数基于数据排序,衡量单调关系,无需分布假设,更适合非正态变量。
  • Kendall’s Tau以变量对方向一致性概率解释相关性,较Spearman更为保守。

- Copula方法通过连接边缘分布刻画联合分布,能够捕捉上尾或下尾相关,超越线性或单调相关的局限。
  • 重点图示Pearson与Spearman对不同数据关系的敏感差异。



2. 资产间相关性实证分析 [page::13][page::14][page::15][page::16][page::17][page::18][page::19]

  • 通过随机抽样框架,多次计算沪深300、中证国债、中证货币基金、黄金指数间相关系数,强调避免选取特定时间窗口分析的偏误。

- 表格示例:随机两只指数相关系数对比

| (IndexX, IndexY) | Pearson | Spearman | Kendall | Clayton | Gumbel |
|--------------------|---------|----------|---------|---------|--------|
| 1 | 0.8361 | 0.7958 | 0.6178 | 0.7792 | 0.6797 |
| 2 | 0.9337 | 0.9272 | 0.7794 | 0.8702 | 0.8075 |
| ... | ... | ... | ... | ... | ... |
  • 资产间多表现微弱正相关,尾部相关显示一同大涨的概率略大于一同大跌。

- 各类相关指标在不同资产对之间存在不一致,单独依赖任何一种指标存在风险。
  • 股票和债券、股票和货币基金等资产对部分样本体现负相关,尾部相关性不显著。

- 黄金与权益资产相关性多为正,上尾相关较为明显,反映部分避险与市场联动特征。

3. 结论与应用建议 [page::19]

  • 各类相关性评估方法各有优缺点,市场上资产间相关性构造复杂。

- 综合运用Pearson、Spearman、Kendall以及Copula等多种方法,有助于深入捕捉资产间线性、单调及尾部关联。
  • 资产配置中,应规避过度依赖单一相关指标,合理利用尾部相关分析降低极端风险。

- 采用随机抽样避免数据选取偏差,强调分散风险的重要性。

深度阅读

金融数量方法论专题报告详尽分析



1. 元数据与报告概览


  • 报告标题:《资产配置中不可忽视的相关性分析:Pearson-Spearman-Kendall-Copula》

- 作者:张志鹏(爱建证券研究所分析师)
  • 发布机构:爱建证券有限责任公司研究所

- 发布日期:2019年10月15日
  • 研究对象:金融资产配置中的相关性分析方法,涉及沪深300指数、中证国债指数、中证货币型基金指数和SGE黄金9999等资产。

- 报告主题:系统介绍和比较了四种常用资产间相关性衡量方法(Pearson, Spearman, Kendall和Copula),重点探讨其在资产配置中的应用价值、假设限制及实际表现,为资产配置时相关性分析提供参考。
  • 核心论点

- 资产配置中的风险分散关键依赖于对资产间相关性的准确理解。
- 单一相关系数可能存在误导,特别是当相关系数为零时并不代表无关联。
- 数种相关系数方法互补,通过多方法结合可更全面判断资产相关性。
- Copula方法引入尾部相关,能捕捉极端市场状况下资产联动,尤其适用风险管理。
- 随机抽样分析表明资产间普遍呈现微弱正相关性,且尾部相关尤为重要。
  • 风险提示:基于历史数据分析不代表未来表现,结果仅具统计意义,存在策略失效风险。[page::0,1]


2. 逐章节深度解读



2.1 简介


  • 提出了资产配置中相关性分析的基础意义,凸显相关性在风险分散中的作用。

- 资产间回报可能存在线性、单调及非线性关系,相关系数无法全覆盖这些复杂关系。
  • 强调即使相关系数为零也不能盲目认为资产完全独立,避免相关性分析的误区。

- 提出多方法结合的理由和必要,据此展开后续分析。[page::3]

2.2 关联性的衡量方法



2.2.1 Pearson相关系数


  • 由Karl Pearson发明,衡量两个连续变量间的线性关系。

- 数学定义为变量间协方差与标准差的比值,取值范围[-1,1]。
  • 线性正相关时取正值,负相关时取负值,绝对值越大关系越强。

- 计算假设包括:变量正态分布、连续型、存在线性关系。
  • 举例说明相关系数为零但变量非独立($\mathrm{Y}=\mathrm{X}^2$)的问题,提醒投资者Pearson仅反映线性关系,难以揭示非线性依赖。[page::4]


2.2.2 Spearman等级相关系数


  • 基于变量排名的非参数检验,不要求数据分布。

- 衡量单调关系,数值越接近±1,单调性越强。
  • 用两个变量的秩间协方差计算,也有简化的差值平方公式。

- 图表1显示Pearson与Spearman的差异:前者仅度量线性,后者度量单调,能捕捉非线性但单调的关系,如图右下例虽相关系数近零但存在非线性依赖关系。
  • 说明Spearman对非正态、非线性数据更具鲁棒性。[page::5,6]


2.2.3 Kendall’s Tau


  • 由Kendall于1938年提出,基于观测值间一对对变量变化方向一致或不一致的概率差。

- 衡量变量间一致性,取值范围[-1,1],数值越大表示单调关系越强。
  • 关键点在于计算一致对数(C)与不一致对数(D)的比例,忽略具体数值大小,仅关注方向。

- 提出Tau-b修正考虑数据中出现不变项的情况,提高相关性准确度。
  • Kendall更强调相关的概率意义,较Spearman对测量变量单调依赖更敏感。

- 介绍了其他相关方法如Stuart’s Tau-c等,提示相关衡量的多样性。[page::7]

2.2.4 Copula


  • 介绍Copula的定义及数学基础,指出其将多维联合分布拆解成边缘分布与关联结构的独特优势。

- Copula不仅限于线性或单调相关,能捕捉复杂多维依赖,包括尾部相关性。
  • 通过Copula密度函数表达变量间联合行为,结合边缘概率分布。

- 提及金融领域运用始于1999年,强调尾部相关系数的重要性。
  • 图表2展示Gaussian、Student’s t、Clayton、Gumbel四种Copula下的数据样例,线性相关均约0.7,但尾部相关特征明显不同。

- 具体Copula数学形式展现,Gaussian Copula对尾部不敏感,Student’s tCopula表现对称尾部相关,Clayton专注下尾(熊市),Gumbel关注上尾(牛市)。
  • 尾部相关系数的定义明确为极端高/低值联动概率,有利于准确把握市场风险极端状况。

- 通过参数估计技巧(CML方法)对Copula参数进行估算,强调不需假设边缘分布,虽经验分布可能偏差。
  • 结合前述Copula理论,解析尾部相关在熊牛市风险管理、资产配置的差异化意义。[page::8-12]


2.3 资产间的关联性实证分析



2.3.1 相关系数计算方法综述


  • 明确提出三类相关性度量类别:线性(Pearson)、等级(Kendall, Spearman)、尾部(Clayton,Gumbel)。

- 强调各方法均有缺陷,单一方法易导致判断偏差。
  • 采用较为客观的随机抽样方法(30个时间段,每期取100个样本),避免择时和样本偏差。

- 以沪深300等四种资产代表权益、债券、货币和商品资产类别,展开跨类别和同类别资产之间的相关性研究。[page::13]

2.3.2 资产相关系数结果解读


  • 表格2(随机选取两只指数的相关系数)显示:

- 指数间普遍存在正相关,相关系数平均较高。
- Kendall比Pearson更保守,表现相关系数偏低。
- Clayton和Gumbel揭示较大尾部相关,强调风险共振的重要性。
  • 表格3 & 4(沪深300与中证国债、中证货币型基金相关性):

- 相关性表现为正负交替,整体偏低。
- 尾部相关不显著,但上尾略优于下尾。
- 不同方法偶有相悖结果,例如某些样本中Pearson呈正或负而其他方法相反,凸显单一指标风险。
- 说明在资产配置时,股债、股货币资产多样化仍需注意其动态复杂性。
  • 表格5(沪深300与SGE黄金9999相关性):

- 大多时间显示正相关,尾部相关尤其在上尾更为明显。
- 黄金作为避险资产,正相关尾部现象提示在极端市场上涨阶段两者可能同步上涨,降低其作为避险工具的传统地位认知。
- 详细计算沪深300在黄金上涨区间的涨跌天数与平均幅度,支持尾部相关的实际市场行为解读。
  • 表格6为资产间聚合统计:

- 股票与债券、货币资产间低相关甚至负相关,债券与货币资产间相关性较强。
- 大多数资产间呈微弱正相关。
- 尾部相关整体表现上尾相关更为普遍,暗示在牛市行情中资产共同上涨的概率高于熊市中的共同下跌。
  • 附录(表7至表9)提供了不同资产组合间的详细相关系数,丰富数据支持结论一致性。


整体实证表明,资产间相关性非恒定,且不同衡量方法得到不同结果,显示资产配置时需要多角度结合判断,以避免过度依赖单一相关系数的局限。[page::13-23]

2.4 总结


  • 报告回顾了Pearson、Spearman、Kendall及Copula的理论与实现。

- 通过大样本随机抽样方法,实证检测多种资产间相关性的方法差异和潜在矛盾。
  • 发现多数资产微弱正相关,部分资产出现显著尾部相关,尤其同时大涨的概率较同时大跌更大。

- 强调单一方法如Pearson不足以判断资产真实相关性,应结合非线性和尾部相关工具综合决策资产配置。
  • 最终梳理了资产风险分散的复杂性和关联性的动态性,倡导量化投资中多方法、全面视角的风险管理策略。[page::19]


3. 图表和表格深度解读



3.1 图表1:Pearson和Spearman相关系数示例图


  • 显示六组数据散点图,每组的Pearson和Spearman相关系数数值并列。

- 前四组为线性相关或反相关,Pearson与Spearman相等或接近。
  • 第五组为随机无序点,Pearson和Spearman均接近零反映无相关。

- 最后一组为U形非线性关系,Pearson和Spearman接近零,但实际存在非线性依赖。
  • 通过对比表明Pearson只测量线性关系,Spearman能捕捉非线性但单调依赖。

- 直观体现两指标的适用范围和局限。[page::6]

图表1 Pearson与Spearman相关系数示例

3.2 图表2:随机生成数据下不同Copula相关结构示例


  • 展示Gaussian, Student's t, Clayton, Gumbel四类Copula生成的点阵。

- 所有图表资料的线性相关系数约0.70,但点云分布差异显著。
  • Gaussian呈对称椭圆分布,尾部分布较散,不特别倾向尾部相关。

- Student's t点云更集中,有明显尾部集群,表现上下尾相关。
  • Clayton显示明显下尾相关,数据下方集聚。

- Gumbel显示上尾相关,上方点群更集中。
  • 图示强调尾部相关结构与传统线性相关的差异,支持用Copula捕捉极端风险依赖。

- 说明在不同市场极端情况下资产关系不同,选择Copula种类需针对实际情况。[page::10]

图表2 Copula随机数据示例

3.3 表格2~9:资产相关系数详细数据


  • 表格2随机选取两只指数相关性显示,多见正相关,表明市场资产普遍联动性强,但尾部相关也显著,简单相关系数不足以捕捉风险共同因素。

- 表格3-5详细列举沪深300与债券、货币基金与黄金的各种方法下相关系数,发现不同方法差异较大,部分情况下相关符号均不同。
  • 表格6为资产间的相关系数统计汇总,显示多数资产相关性为微弱正相关,尾部相关优于整体相关,体现资产在极端市场条件下风险暴露较常规更大。

- 表格7-9补充了债券与货币基金、债券与黄金、货币基金与黄金之间的相关关系,进一步印证不同资产之间存在复杂多样的相关结构。
  • 这些数据表格为理论分析提供了坚实的实证基础,是资产相关性判断的重要参考依据。[page::14-23]


4. 估值分析



本报告主要聚焦于相关性测度的理论介绍与实证应用,未涉及具体的企业估值方法和目标价,因此估值分析环节无直接内容。

5. 风险因素评估


  • 公开声明资产相关性的统计特征基于历史数据,不代表未来表现,存在市场极端变化风险导致相关系数失效的可能。

- 相关性方法存在各自的假设,如Pearson要求正态分布且线性关系,Spearman、Kendall为非参数但不保证捕捉所有依赖形式,Copula虽更灵活但参数估计存在偏差风险。
  • 单一相关指标存在误导性的风险,可能导致资产配置中风险分散效果不佳。

- 随机抽样虽能提高统计代表性,但依然不能完全预测未来市场结构,尾部相关尤需关注极端风险。
  • 报告提醒投资者理解模型局限,警惕策略失效,保持多方法综合判断的谨慎态度。[page::0,13,24]


6. 批判性视角与细微差别


  • 报告对多种相关性衡量方法进行了平衡介绍,避免单一方法的偏见,但仍不免存在一定的选择性偏向,如重点强调Copula的尾部相关性优势,或对Pearson相关系数假设限制的批评较为突出。

- 方法间不一致的实证现象虽得到充分揭示,但未展开更多对不一致成因的细致统计论证,如非稳态市场等因素。
  • 对Copula相关参数估计中经验分布潜在偏差提及不多,未详述实际应用中可能遇到的复杂估计问题和参数敏感性。

- 报告未涉及动态相关系数的变化和更复杂时间序列模型对相关性的影响。
  • 总体上报告保持学术严谨,观点温和,强调方法互补性和背后的假设限制,但缺乏基于实际案例对错误判断案例的深入讨论。

- 某些表格中数据错落或格式问题存在,阅读和理解有一定难度,需谨慎处理。[page::4,8,12,24]

7. 结论性综合



本报告通过系统介绍及应用Pearson、Spearman、Kendall及Copula四个相关性衡量方法,深入剖析资产配置中资产间相关性的复杂性。报告明确指出:
  • 相关性作为风险分散的核心工具,不能依赖单一测度,尤其是传统的Pearson相关系数在非线性、非正态和尾部风险状况下存在重大局限。

- Spearman和Kendall等级相关系数弥补了Pearson对单调非线性依赖的识别不足,更强调秩次排序的统计推断。
  • Copula方法引入尾部相关概念,通过独立边缘分布和联合依赖结构拆分,有效捕捉极端市场上涨和下跌时资产的共同波动特征,验证资产组合在极端市场情形下的风险暴露。

- 实证部分利用随机抽样法,避免单一时段的选择性偏差,显现沪深300、国债、货币基金及黄金四大类资产间普遍呈微弱正相关,但尾部上行相关更显著,极端上涨时资产间共振风险不可忽视。
  • 表格及图表数据详细展示了各类相关性测度的分布和差异,使投资者对资产相关的多维度特征有清晰的认知。

- 报告倡导资产相关性分析应多角度、多指标兼顾,结合尾部依赖评估,提升量化资产配置的科学性和稳健性。

总体来看,本报告为理解和应用相关性测度工具提供了扎实的理论基础和实证支持,强调正确把握资产间相关性的核心地位,有效辅助资产配置与风险管理策略的构建,具有较强的实用价值和专业指导意义。[page::0-24]

报告