`

The local Gaussian correlation networks among return tails in the Chinese stock market

创建于 更新于

摘要

本报告提出并构建基于局部高斯相关系数的中国股票市场收益尾部(正尾和负尾)金融网络,系统分析了节点中心性、最短路径长度和网络熵等指标。研究发现,负尾局部高斯相关网络在揭示市场风险方面优于正尾网络和传统Pearson相关网络,尤其在2007-2008全球金融危机和2015-2016年中国股市波动期间风险表现更为敏感,建议未来研究优先关注负尾局部高斯相关网络捕捉极端风险特征 [page::0][page::3][page::4][page::5][page::6]。

速读内容


1. 数据与样本划分 [page::1]


  • 研究采用2004年至2019年上交所主板所有股票数据,覆盖两次重要股市崩盘(2007-2008全球金融危机与2015-2016国内股市波动)

- 数据被划分为10个时间段,考虑牛熊市波动,剔除缺失过多数据的股票。

2. 研究方法:局部高斯相关与网络构建 [page::2][page::3]

  • 利用局部高斯相关系数捕捉股票收益局部非线性相关性,重点计算收益负尾(5%-20%分位数)和正尾(80%-95%分位数)上的相关系数均值作为连接权重构建网络。

- 采用MST、PMFG、TMFG三种过滤方法提取金融网络骨架,便于比较局部高斯相关网络和传统Pearson相关网络。

3. 网络基本特征比较 [page::3][page::4]


  • 局部高斯相关网络中,负尾相关系数明显大于正尾,且波动崩盘时期相关系数显著上升,显示其风险敏感性强。

- 不同网络类型之间股票节点重要性排名差异明显,说明传统Pearson网络无法替代局部高斯相关网络的风险揭示作用。
  • 中心性分布均呈现重尾和无标度特性,区别在MST过滤下不同网络类型中心性尾部参数存在显著差异。


4. 关键网络指标比较分析 [page::4][page::5]


  • 负尾局部高斯相关网络的平均最短路径低于正尾及Pearson网络,尤其在危机期间显著缩短,表明风险传播能力更强。

  • 网络熵分析显示负尾局部高斯相关网络的熵值最低,反映其韧性差、脆弱性较高,风险水平更为突出。

- 2015-2016国内股灾对负尾局部高斯网络韧性冲击明显强于全球危机,Pearson网络未能捕捉该风险差异。


5. 结论与建议 [page::6]

  • 局部高斯相关网络可有效捕捉金融资产收益尾部的局部非线性与重尾特征,负尾网络反映的风险更具实践意义。

- 传统Pearson相关网络存在盲点,可能低估市场极端风险。
  • 建议未来风险管理与金融网络研究优先考虑负尾局部高斯相关网络,重新审视已有基于Pearson相关的研究结论。

深度阅读

报告详尽分析报告



---

1. 元数据与概览(引言与报告概览)


  • 报告标题:The local Gaussian correlation networks among return tails in the Chinese stock market

- 作者:Peng Liu
  • 机构:School of Information, Xi’an University of Finance and Economics, Xi’an, China

- 时间:未明确具体发布日期,但文中引用文献年份较新(2024,2025年),可推测为近期完成
  • 研究主题:基于局部高斯相关系数构建中国股市收益尾部(极端波动区间)间的网络结构,比较该方法和传统Pearson相关系数构建的金融网络之间的差异与优势,重点关注负尾部(极端下跌区间)的统计依赖,探讨股市风险与网络属性之间的联系。


报告核心论点及主要信息



本文指出传统金融网络构建普遍依赖Pearson相关系数存在三大本质缺陷(不适合重尾分布、对异常值敏感、无法捕捉非线性依赖),这带来误导性和潜在灾难性的风险。基于局部高斯相关系数(Local Gaussian correlation,LGC)这一新颖测度,该研究系统构建了负尾和正尾两类基于极端收益波动局部相关的网络,并与传统Pearson网络进行了对比,发现负尾LGC网络在反映市场风险尤其是危机时期信息方面更加灵敏和有效,强调未来金融系统风险研究应优先采用此类指标重估先前结论。

---

2. 逐章节深度解读



2.1 引言部分


  • 主要论点

- 复杂网络科学为研究系统间复杂关系提供有效工具,金融市场作为典型复杂系统,相关基网络研究自1999年以来广泛展开。
- 传统基于Pearson相关系数的网络构建受限于该系数的适用边界和固有限制,尤其对非高斯分布、异常值和非线性依赖的考虑不足,可能导致严重误判风险。
  • 支撑逻辑

- 举例说明Pearson相关系数在非线性关系(如Y=X²)下可能表现为零,说明其无法反映非线性统计依赖。
- 金融资产收益率具有重尾和非线性相关的典型特征,Pearson相关不适用。
  • 结论

- 需要寻找替代测度,如copula、条件相关、距离协方差等,多种方法中局部高斯相关尤具优势。
- 本文应用局部高斯相关,专注于中国沪市股票尾部收益的非线性局部依赖关系分析,弥补了传统分析不足。[page::0,1]

2.2 数据介绍(Section 2)


  • 数据来源

- 沪市主板全部1542只股票,日收盘价,2004年4月7日至2019年12月31日,共3639462条记录。数据采自东方财富官网。
  • 数据处理

- 按照上证综合指数(SSCI)表现划分为10个时期,分别覆盖牛市和熊市。期间含有两次重大市场崩盘:2007-2008年全球金融危机和2015-2016年A股剧烈波动。
- 数据清洗:剔除缺失收益数据超过30天的股票,保证计算的准确性。
  • 意义

- 划分时段结合市场行情,利于观察极端事件对网络结构性质的影响,尤其尾部相关的动态变化。
  • 图表分析

- 图1:SSCI指数走势图,直观表现各时期牛熊交替,标明研究窗口覆盖关键风险事件,以实证检验负尾依赖特征。
- 表1:详细列示10个时期起止时间、SSCI涨跌幅、可用股票数量及交易天数,体现数据完整性与样本代表性。[page::1]

2.3 方法:局部高斯相关及网络构建(Section 3)


  • 关键技术解释

- 局部高斯相关(Local Gaussian correlation)通过在每个数据点局部用二维高斯分布逼近经验的联合分布,估计局部相关系数$\rho(x)$。其核心优势是能捕捉变量间的非线性和局部依赖结构,尤其适合重尾的金融数据。
- 公式明确给出局部双变量高斯密度定义及参数含义,即局部均值$\mui(x)$,局部标准差$\sigmai(x)$和局部相关系数$\rho(x)$。
  • 估计细节

- 使用R包localgauss执行估计,带宽选取基于Plug-in方法$b=1.75\sigma n^{-1/6}$,并通过稳健性测试验证结果对带宽敏感性小。
  • 网络构建步骤

- 重点关注收益曲线的两个尾部区间(负尾部5%-20%分位、正尾部80%-95%分位)。
- 对每对股票,计算局部高斯相关系数沿对角线在尾部分位区间的均值作为链接权重。
- 利用三种过滤算法提取网络骨干:最小/最大生成树(MST)、平面最大过滤图(PMFG)和三角最大过滤图(TMFG)。
- 同期构建基于Pearson相关的网络,方便对比。
  • 逻辑点明

- 过滤方法保证网络稀疏性与可解释性,且广泛应用于金融相关系网络研究。
- 对尾部重点建模意在捕获极端风险的依赖结构,负尾部尤为重要。[page::1,2]

2.4 网络度量指标(Section 4)



详细介绍将要分析的网络指标,包括:
  • 节点中心性:

- 强度中心性(节点连接权重之和,反映直接影响力和连接强度)
- 特征向量中心性(节点的影响力还考虑连接节点的中心性,体现间接影响力)
  • 平均最短路径长度

- 衡量网络中节点对之间的典型最短联系距离,关键以"风险传播能力"做类比,路径短则风险更容易传播。
- 计算基于边权转换为距离$d{ij}=\sqrt{2(1-w{ij})}$
  • 网络熵指标

- 分别采用Shannon熵、Renyi熵、Tsallis熵测量网络的结构多样性和弹性。
- 基于权重归一化的转移概率矩阵构造节点熵,再根据站稳分布加权汇总得到整体网络熵。
- 其中$\beta=0.1$为参数,稳健性测试表明结果对$\beta$较为稳定。
  • 功能意义:节点中心性关联资产价格行为和系统性风险能力,路径长度反应危机传导速度,熵反映网络多样性和弹性,全面反映复杂金融系统的结构性质。[page::2,3]


2.5 经验结果与讨论(Section 5)


  • 相关系数分布分析(图2):

- LGC负尾相关系数普遍大于正尾部,反映负尾风险关联性强,风险传染通路密集。
- 两次重大崩盘(2007-2008全球金融危机和2015-2016中国股市波动)期间,负尾相关显著提升,2015年国内危机影响更大(相关系数涨幅更明显)。
- Pearson相关分布与LGC不同,表明传统相关度可能错判风险关联。
  • 节点排名重叠度分析(图3):

- 对比负尾LGC、正尾LGC和Pearson网络通过MST、PMFG、TMFG三种过滤后的前十节点排名,
- 同一类型间相关性极高,结合三个过滤方法结果稳定;
- 不同类型之间排名差异显著,体现不同相关度测度网络捕获的核心股票截然不同,进一步提示研究需重视LGC方法。
  • 中心性分布尾形参数(图4):

- 用广义帕累托分布拟合节点强度和特征向量中心性的尾部,三个网络均呈现重尾,说明都具备一定的规模无关性(scale-free)。
- MST过滤下,不同网络类型尾形参数存在显著差异,PMFG和TMFG过滤下差异不显著,表明不同过滤方法会影响网络拓扑特征表现的敏感度。
  • 平均最短路径长度(图5):

- 负尾LGC网络的平均路径长度在绝大部分周期均比正尾LGC和Pearson网络小,说明其风险传播路径更短、更迅速。
- 两次崩盘期间路径长度均显著缩短,2015年国内崩盘效应更显著。
- Pearson网络估计风险传播能力偏低,未能捕获负尾真实风险关联强度。
  • 网络熵指标(图6):

- 三种熵指标均显示负尾LGC网络的网络熵低于正尾LGC,意味着其网络弹性和恢复力较差,负尾网络在危机时表现出较差的韧性。
- 2007-2008全球金融危机对熵变化影响有限,2015-2016中国市场危机对负尾网络熵有显著负面影响,体现国内市场风险特有的严重性和复杂性。
- Pearson网络中的最小熵滞后出现于危机后期,反映其在识别风险时滞后。
  • 综合说明

- 负尾LGC网络在风险检测和危机环境下结构揭示方面优于传统方法;
- 国内危机对金融网络影响较大,建议研究和监管关注该类网络指标动态。[page::3,4,5]

---

3. 图表深度解读



图1(第1页)


  • 描述:展示SSCI(上证综指)2004-2019的每日收盘走势,并依据指数波动划分为10个时期,颜色区分牛市(绿色)与熊市(红色)。

- 趋势与解读:两轮重要崩盘清楚可见:2007末至2008初全球金融危机及2015年中至2016年初国内股市波动,支撑研究聚焦极端市场风险的正当性。
  • 支持文本:该图为研究提供时间框架与宏观市场环境背景,帮助进一步分析网络属性随市场风格切换的表现。[page::1]


表1(第1页)


  • 描述:对应分期的时间范围、指数涨跌幅、可用股票数及交易日数。

- 关键数据点
- 熊市时期股票数量一般多于牛市,如P1、P3、P5等,成交活跃严肃;
- 指数涨跌幅巨幅变化,如P3期-73%、P2期+514%,反应市场极端波动。
  • 文本呼应:为网络的每期构建提供数据严谨性保证,剔除数据缺失严重的个股。

[page::1]

图2(第3页)


  • 描述:以箱线图展现10个周期内三类相关系数分布:负尾LGC(绿)、正尾LGC(紫)、Pearson $\rho$(灰)。

- 趋势分析
- 所有相关集中正相关区间,负尾LGC数值总体最高,显示极端下跌风险之间的更强联系;
- 危机期间相关系数显著上升,特别2015-2016年国内危机更突出;
- Pearson分布模式与LGC显著不同,尤其体现不同尾部依赖信息。
  • 文本联系:明确表明LGC网络,尤其负尾部分,捕捉的风险关联更贴合实际,更值得关注。[page::3]


图3(第4页)


  • 描述:矩阵热力图形式展示负尾LGC、正尾LGC、Pearson三种网络于最后一期内筛选前十节点间的重叠个数,分别展示强度中心性与特征向量中心性两种排名间的重合度。

- 数据洞察
- 同类型网络内部节点选择高度一致一致(对角线最大,9-10个重合),三种过滤算法的差异很小。
- 不同类型间节点重叠很少(一般1-4个左右),说明核心节点选取差异显著。
  • 文本支撑:定量体现不同网络测度带来不同投资风险视角和核心节点,强调基于传统Pearson相关的结论存在偏差。[page::4]


图4(第4页)


  • 描述:采用广义帕累托分布拟合三个网络在各期下强度中心性和特征向量中心性分布的尾形参数,区分三种过滤方法。

- 数值解读
- 尾形参数均为正值($\xi>0$),确认了中心性分布均为重尾分布,网络规模无关性质明晰。
- MST过滤下三种网络的尾部参数存在显著差异,PMFG和TMFG过滤则表现较为一致。
  • 理论意义:重尾特征保证网络中存在少数“超级节点”,权重集中,影响网络稳定性和攻击容忍性,MST方法更能揭示不同网络结构的差异性。[page::4]


图5(第5页)


  • 描述:展示三种网络类型在10期、三类过滤方法下的平均最短路径长度随时间变化,用紫带标明关键崩盘期。

- 趋势解读
- 负尾LGC的路径长度持续低于正尾LGC和Pearson,表明其网络更紧密,风险传播路径更短。
- 崩盘期路径明显下降,风险集中且传播速度加快,2015年国内危机影响尤重,体现危机应激反应。
- Pearson网络虽跟随趋势,但路径长度整体偏大,低估风险扩散能力。
  • 文本呼应:负尾LGC网络反映风险传导更强,强调高度关注负尾风险的重要性。[page::5]


图6(第5页)


  • 描述:三个网络类型各种熵指标的时间序列,反映网络弹性。

- 数据解析
- 负尾LGC网络熵最低,显示其网络结构稳定性较差,脆弱性较高。
- 2015-2016年国内崩盘期间负尾LGC网络熵急剧下降,韧性受到严重冲击;
- 2007-2008全球危机影响较轻,Pearson网络的熵最小点比负尾LGC滞后一个时期,表明传统方法反应滞后。
  • 综合说明:网络熵作为风险韧性指标,彰显负尾LGC网络捕获风险能力更敏感且更具实用价值。[page::5]


---

4. 估值分析(未涉及)



本报告主要为方法学和应用实证研究,重点在金融网络构建和指标比较,无涉及具体公司估值,故无估值部分。

---

5. 风险因素评估(间接体现)



尽管未专设风险部分,可从报告内容隐含风险因素:
  • Pearson相关的应用风险

- 由于其对重尾、非线性依赖的忽视,使用者容易低估极端风险,导致模型不准确,甚至引发灾难性错误。
  • 数据质量风险

- 处理缺失数据标准严格,但部分时期股票数异动,可能对网络稳定性造成影响。
  • 模型假设风险

- LGC的局部高斯逼近假设是否完全符合实际数据分布仍有一定理论限制,需持续验证稳健性。
  • 市场特殊风险

- 2015年国内市场影响巨大,结果表明特殊市场环境可能带来不同网络结构特征,应结合宏观经济政策与市场行为考量。
  • 缓解建议

- 本文通过多个过滤方法和参数稳健性检验减少模型风险。
- 推荐未来研究多角度融合,动态调整网络分析框架。

---

6. 批判性视角与细微差别


  • 优点

- 创新地将局部高斯相关应用于金融尾部数据,理论与实证结合紧密;
- 多过滤方法和多熵指标综合分析,结果稳健;
- 明确揭示国内市场特殊风险特征,具有实际监管和风险管理指导意义。
  • 潜在不足与警示

- 研究主要局限于上海主板股票,未覆盖深交所、新兴市场和其他金融资产,范围有限;
- 局部高斯相关计算复杂度高,实际应用中对高频数据或大规模资产组合的计算效率和稳定性有待考察;
- 文中负尾和正尾定义为固定分位区间,灵活性不足,动态尾部特征可能被掩盖;
- 跨期对比部分因样本股票数变化较大,对结果解释偶有影响,需谨慎解读。
  • 交叉视角

- 文中提及LGC负尾网络更敏感,但对正尾网络和传统网络的互补性未作深入探讨,未来或为联合模型提供研究空间。

---

7. 结论性综合



本文系统揭示了局部高斯相关网络(LGCNET)在捕捉中国股市收益极端尾部风险依赖结构中的卓越表现,尤其是在负尾部网络中表现出更高的相关性、更短的风险传播路径和更低的网络韧性,反映出市场系统风险的集中与易损性。对比传统Pearson相关系网络,负尾LGC网络不仅能更敏锐地反映市场崩盘期间风险形成与扩散过程,还揭示了国内股市2015-2016年危机对市场网络结构造成的显著冲击,超过了2007-2008年全球金融危机的影响。

具体而言:
  • 数据覆盖16年,包含2大危机,保证结果的代表性和现实相关性;

- 通过MST、PMFG、TMFG三种网络过滤,确保结构分析的稳健性和多角度验证;
  • 负尾部局部高斯相关系数显著高于正尾及Pearson相关,强调了极端下跌风险间强烈的非线性统计依赖;

- 节点中心性的重尾性质表明市场存在关键“影响力节点”,风险传染路径短、弹性低,负尾LGC网络在危机时表现尤为突出;
  • 传统Pearson网络在识别负尾风险及风险传导能力上存在显著低估,难以准确反映真实风险结构。


综上,作者强烈建议金融风险研究及监管部门优先采用局部高斯相关系数方法,特别是负尾依赖网络视角,来重新评估金融市场系统性风险,以期获得更加真实、准确、安全的风险预测和管理效果。

---

参考溯源标注



本文全部分析均基于报告原文内容,引用具体内容时标明页码,具体如:
  • 介绍及理论基础:[page::0,1]

- 数据与方法说明:[page::1,2]
  • 网络指标定义:[page::2,3]

- 经验结果详解及图表解读:[page::3,4,5]
  • 结论与展望:[page::6]


---

总结



本报告从理论出发,以翔实的中国股票市场数据为依托,创新使用局部高斯相关系数捕获负尾部极端风险的非线性依赖关系,结合丰富的网络度量和过滤技术,系统比较并超越传统Pearson相关网络,提供了金融风险系统性分析的重要新思路。其研究结果对金融风险预警、资产配置、监管政策制定均具有显著参考价值。未来相关领域研究应当深入验证、推广这一方法,并结合跨市场、跨资产、多频率数据提升模型的通用性与前瞻性。

报告