【国君金工 学界纵横系列】基于非层次聚类的风险平价资产配置模型
创建于 更新于
摘要
本文提出一种基于非层次聚类的风险平价资产配置模型,通过结合新型稳定的x-means++聚类算法,有效识别资产的共同风险来源,实现每个风险来源的风险贡献均衡。实证分析显示,该模型在全球股指期货与国债期货的长期样本中,优于传统风险平价及层次聚类模型,收益风险比最高且风险控制表现良好,提升了资产配置的稳健性与有效性 [page::0][page::1][page::4][page::5]。
速读内容
- 本文结合x-means与k-means++算法,提出了新型x-means++非层次聚类算法,解决了传统k-means聚类难以确定聚类数及对初始质心敏感的问题,实现聚类数自动确定且初始化更加稳定 [page::1][page::2][page::3]。
- 基于x-means++算法按风险来源对15种全球股指期货及12种国债期货进行分类,假设价格走势相近的资产揭示了相同风险来源,从而在聚类层面实现风险平价,确保每个风险来源的风险贡献均衡,再在同一聚类内资产间均分该风险 [page::1][page::4]。
- 实证采用2001年4月至2020年5月的样本,比较传统风险平价策略(RP)、层次聚类风险平价策略(HRP)、基于k-means++的非层次聚类风险平价策略(CRP,k从2到8)与基于x-means++的非层次聚类风险平价策略(XRP):
| 策略 | 年化收益率(%) | 年化风险(%) | 收益风险比 | 最大回撤(%) |
|---------|-------------|------------|------------|-------------|
| RP | 2.31 | 2.04 | 1.14 | 7.24 |
| HRP | 1.22 | 1.35 | 0.90 | 3.93 |
| CRP7 | 3.31 | 2.83 | 1.17 | 7.48 |
| XRP | 3.06 | 2.25 | 1.36 | 7.07 |
XRP策略在全样本期内实现最高收益风险比,风险控制优于大多数CRP策略,最大回撤接近HRP最低水平,表现稳健 [page::4][page::5]。
- 非层次聚类风险平价模型解决了传统风险平价模型忽视资产相关性问题,通过先分类聚类,再风险平价,有效避免组合过度暴露于相近风险来源,提升风险分散效果。[page::5]
- 作者指出该聚类分类思想还可扩展到基于估值(如PE)或流动性(如换手率)的资产细分,实现更为灵活和个性化的资产配置策略。[page::5]
深度阅读
深度解读报告:《基于非层次聚类的风险平价资产配置模型》
---
1. 元数据与概览
- 报告标题:基于非层次聚类的风险平价资产配置模型
- 作者:陈奥林、徐浩天、Allin君行
- 发布机构:国泰君安证券研究所,国君金工团队
- 发布日期:2022年4月22日
- 主题:资产配置模型,风险平价策略,非层次聚类算法
报告核心论点
报告提出了一种创新的资产配置模型,结合非层次聚类算法x-means++与传统风险平价策略,旨在优化风险分配。模型假设价格走势相似的资产拥有共同的风险来源,利用非层次聚类划分资产组别,风险平价策略不仅平衡各资产的风险贡献,更在各风险来源层面实现均衡。实证显示该模型在收益与风险控制方面优于传统风险平价模型和层次聚类风险平价模型,能够有效规避由风险来源集中导致的潜在高风险敞口[page::0,1,4,5]。
---
2. 逐节深度解读
2.1 摘要与选题背景
摘要明确指出传统风险平价策略虽平衡个别资产风险贡献,但忽视了资产间风险来源的重合,带来集中风险。为解决此问题,作者创新性结合两类非层次聚类算法(x-means与k-means++)形成x-means++算法,该算法兼具确定最佳聚类数及降低初始质心依赖的优势。其结果是构建出一个能够同时平衡每个风险来源(聚类)及其内部资产风险贡献的风险平价资产配置模型[page::0]。
选题背景强调,资产配置作为投资核心,通过在高风险和低风险资产间多样化分配旨在提升收益同时控制风险。资产权重配置的优化关键在于识别和分散风险[page::0]。
2.2 数据来源与聚类算法介绍
作者利用2001年4月至2020年5月间全球15种股指期货和12种国债期货的价格数据,涵盖标普500、纳斯达克、日经225及多种国债期货等。详见报告表1所列资产种类和对应代码[page::1]。
报告重点解释了非层次聚类中使用的k-means算法,并详细列出其缺陷:
- 需预先指定聚类数量k
- 初始质心的选择对聚类结果依赖较大,容易陷入局部最优
为此引入x-means算法,能自动确定最佳聚类数量;k-means++算法则优化初始质心选择。二者结合形成x-means++算法,兼顾了确定聚类数和稳定质心选择两大优点,具体优势和缺点对比如表2所示[page::1,2]。
2.3 x-means与k-means++算法细节
- x-means算法通过下述步骤递归划分数据集,应用贝叶斯信息准则(BIC)比较当前聚类和递归划分后的BIC值,决定是否继续分割,直到确定最优的聚类数量。该方法假设每个聚类内资产服从多维正态分布,其BIC计算涉及极大似然估计参数以及样本量等,精准化聚类判定过程[page::2,3]。
- k-means++算法重点改进初始质心的选取,随机选择首个质心后,以距离平方作为选取概率分布,优先选择距离现有质心较远的数据点作为新质心,增强聚类稳定性。这一步避免了k-means随机初始点带来的不确定性[page::3,4]。
2.4 非层次聚类风险平价策略模型构建
在获得非层次聚类结果(聚类数量k,各聚类资产数量Nj)基础上,作者设计风险平价优化目标,旨在最小化资产的风险贡献与均衡目标的平方差:
\[
\min{w} \sum{j=1}^k \sum{i\in j} \left(RCi - \frac{1}{k} \times \frac{1}{Nj}\right)^2
\]
其中, \(RC_i\) 为资产i的风险贡献。限制条件保证权重正向且总和为1。此模型逻辑先在聚类风险层面平衡风险贡献,再在同聚类资产间均分该风险贡献,从模型设计层面强化了不同风险来源的风险均衡[page::4]。
2.5 实证分析步骤与结果解读
实证基于全球27种期货资产价格,分析时间为2001年至2020年。关键步骤包括:
- 计算滑动窗口(前250个交易日)收益率序列和协方差矩阵
- 使用收益率作为聚类距离指标,应用层次聚类(HRP)、k-means++以及x-means++不同方法对资产聚类
- 构建基于不同聚类策略的风险平价组合:传统RP,HRP,k-means++不同k取值的CRP,以及x-means++的XRP
- 比较各策略收益风险表现
表3总结了各方法在完整期(20年)及前后两段10年期内主要指标:
- 收益风险比(年化收益除以年化风险)
- 年化收益率
- 年化风险
- 最大回撤
XRP策略整体表现突出,在完整期收益风险比为1.36,明显优于传统RP(1.14)和HRP(0.90),且相较于k-means++策略CRP在k=7时稍低收益,但风险控制(最大回撤7.07%)优于大部分CRP配置。此外,XRP在前10年和后10年均表现出收益风险比领先优势,显示出非常好的稳健性和持续性[page::4,5]。
---
3. 图表深度解读
表1:投资资产清单
清晰罗列了15个股指期货和12个国债期货标的及其代码,包括美股、日股、欧洲和澳大利亚的重要指数与国债。此数据覆盖全球主要资本市场,保证模型应用的广泛性和实用性[page::1]。
表2:聚类算法对比
| 算法 | 优势 | 劣势 |
|-------------|--------------------------------|-----------------------|
| k-means | 简单易用,运算速度快 | 依赖质心初始值,k难确定 |
| k-means++ | 质心选择更合理,效果更稳定 | 依然需指定聚类数量k |
| x-means | 自动确定聚类数量 | 依赖初始质心 |
| x-means++ | 自动确定聚类数量,质心稳定 | 无明显劣势 |
该表系统对比凸显x-means++的优势,是传统k-means与x-means算法的有机融合,提升聚类精度及稳定性,为后续模型的构建提供坚实基础[page::2]。
表3:实证结果汇总
- 年化收益率:XRP达3.06%,位列前三,略次于CRP7(3.31%)但超过传统RP(2.31%)和HRP(1.22%)。
- 年化风险:XRP风险2.25%,低于CRP大多数k值,略高于RP,但在风险收益比表现最佳。
- 收益风险比:XRP最高(1.36),优于RP(1.14)、HRP(0.9)且略优于CRP7(1.17)。
- 最大回撤:XRP最大回撤7.07%,低于传统RP(7.24%)、CRP多个k值,略高于HRP(3.93%)。
分时间段分析表明XRP策略在前后十年均保持稳健,尤其在后十年收益风险较高且最大回撤最低(4.23%),显示其适应不同市场环境的能力[page::4,5]。
---
4. 估值分析(模型架构层面)
本报告核心为资产配置风险管理,严谨估值方法未作为主线,但风险平价的优化目标明确体现了通过求解最优权重来平衡风险贡献,属于经典风险预算框架。利用非层次聚类划分风险来源,确保风险的多元化均衡,减少了隐藏的风险暴露。优化目标函数结合了风险贡献模块,是当前风险管理和资产配置中较为前沿的做法[page::4]。
---
5. 风险因素评估
报告隐含风险主要源于:
- 聚类算法的稳定性与准确性:尽管x-means++提升了聚类效果,市场环境变化和模型假设(资产收益率服从正态分布)可能导致实际聚类偏差。
- 模型假设:假设价格走势相近的资产共享风险来源,现实中风险来源可能随时间变化,信息延迟或市场异常状况可能使得该假设偏离实际。
- 历史数据的代表性:过去20年市场环境复杂,模型效果受限于样本时间段特征,未来可能出现无法有效捕捉新兴风险的情况。
- 操作限制:风险平价策略对权重约束较严格,市场流动性变动或交易成本没有详细考虑,可能影响实盘执行效果。
报告对风险提示未做细致解析,但作者通过稳健的实证对比间接回应了模型稳健性问题[page::5]。
---
6. 批判性视角与细微差别
- 模型依赖历史收益率协方差,假设协方差稳定且高斯分布近似合理,这在极端市场波动时可能失效,容易低估尾部风险。
- 聚类假设的普适性:虽然非层次聚类减少了某些层次聚类算法的局限,但算法本身基于距离度量和统计信息,可能忽略其他非线性关系或市场结构性因素。
- 风控指标单一:实证仅展示年化收益率、风险、最大回撤与收益风险比,缺乏夏普比率、下行风险等多维风险指标,细节分析稍显不足。
- 交易成本和市场影响未考量,实际应用中多资产频繁调整带来的成本可能削弱策略收益。
- 实证期间包含多个市场周期,潜在过拟合风险及模型对于未来未知风险的适应能力存疑。
整体而言,报告方法严谨,数学基础扎实,论据充分,是当前风险平价组合研究中具有创新意义的工作。
---
7. 结论性综合
该研究报告提出并验证了一种基于创新非层次聚类算法x-means++的风险平价资产配置模型。通过首先将资产按收益率走势划分为不同风险来源聚类,再在聚类内外均衡风险贡献,模型有效规避了传统风险平价策略忽视资产间相关性导致的风险集中问题。
实证基于近20年全球主要股票及债券期货市场数据,结果显示该策略在收益稳定性与风险控制方面均显著优于传统风险平价及层次聚类风险平价策略,收益风险比和最大回撤表现均衡优异。详细数据见实证结果表3,强调x-means++算法的聚类稳定性与自动确定聚类数的优势对于提高资产配置模型性能至关重要。
报告还提出了将资产按其他属性(如估值、流动性)分类,结合不同策略加权配置的未来方向,展示了该方法的灵活性和广泛应用潜力。整体来看,本文对资产配置领域在风险分散和风险来源管理方面提供了理论与实操的有益补充,有望指导专业投资者优化组合风险控制,实现更稳健的投资目标[page::0,1,2,3,4,5]。
---
8. 图表引用示意
- 报告页首图:国君金工研究标志

---
总体评价
本报告系统介绍了非层次聚类技术结合风险平价策略的创新资产配置方法,数学推导与实证分析严谨,数据全面,论点清晰,创新点突出。适合高级金融工程研究者及风险管理实务者深度研读。其提出的x-means++算法及分层风险平价思路为资产配置的风险管理开辟了新的路径,理论价值和实用意义兼备。