`

Machine Learning-based Relative Valuation of Municipal Bonds

创建于 更新于

摘要

本报告基于CatBoost算法,提出了一种监督式相似度学习框架,用于衡量市政债券之间的相对价值。通过多目标回归预测债券的OAS和收益率,模型能够基于风险特征识别相似债券组,从而实现更精准的相对价值排序。实证结果显示,该方法在不同市场环境下通过对比回测优于传统规则基方法和收益率排序法,尤其能规避仅靠高收益带来的风险积累,提升投资组合的风险调整收益表现[page::0][page::1][page::5][page::6][page::7]。

速读内容

  • 市政债券交易市场规模约4万亿美元,交易活跃度低且市场分散,导致债券相对估值复杂[page::0]。

- 传统规则基于“到期时间乘以利差”(DxS)的相似性度量存在主观设定权重难题,且无法捕捉债券复杂特征间非线性关系[page::1]。
  • 本文采用CatBoost梯度提升树,结合多目标回归同时预测债券的Options-Adjusted Spread (OAS)与收益率,学习出债券间的相似度,用以构建风险特征相似的债券组[page::1][page::2]。

- 相似度定义基于树模型叶节点共现情况,加权考量各树对残差预测的贡献度,实现比随机森林更精准的接近度量[page::1]。
  • 训练数据包含约225,000只符合信用质量筛选的债券,包含22个特征(11类数值型,11类分类型),通过CatBoost自动编码类别变量[page::3]。

- 训练与回测期间涵盖2019至2024年多个市场周期,包括低息及高息及疫情波动期,确保模型稳健性[page::3][page::4]。
  • CatBoost在多指标评价(MAE, MSE, R2等)中优于弹性网、决策树及随机森林,表现稳定且准确[page::5]。


| 模型 | 数据集 | R2 | MAE | MSE | MAPE |
|---------------|--------|--------|--------|--------|--------|
| 弹性网 | 测试集 | 0.61 | 37.26 | 39.40 | 1.9 |
| 决策树 | 测试集 | 0.765 | 15.20 | 30.59 | 1.11 |
| 随机森林 | 测试集 | 0.833 | 12.88 | 25.74 | 0.86 |
| CatBoost | 测试集 | 0.87 | 12.26 | 22.54 | 0.88 |
  • SHAP分析揭示,评级、剩余期限和债券发行主体数为预测OAS的主要变量,剩余期限、选择权属性及发行主体数则对收益率影响最大:

  • 设计了包含收益率排序、规则DxS法和基于CatBoost相似度三种排名方法的回测,比较不同模型对债券未来表现的预测能力[page::2][page::5]。

- 回测覆盖2019年至2024年多个市场阶段,关键发现包括:
- 大多数行情下,CatBoost相似度排序方法表现优于规则基和收益率排序,能更有效识别高回报债券,且表现更稳定[page::5]。
- 在升息剧烈波动期,策略表现波动加剧,但相似度法仍显示相对优势[page::5]。
- 仅用收益率排序虽在部分阶段表现较强,但由于未调整风险,可能带来风险积累,策略稳健性较差[page::5]。
  • 总结认为监督式碳求相似度学习结合多目标CatBoost回归,为稀缺交易数据的市政债券市场提供了精准的相似组识别与相对估值框架,未来将探索基于动态相似度的市场分群与原型债券识别[page::6].

深度阅读

研究报告详尽分析报告



---

1. 元数据与概览



报告标题:Machine Learning-based Relative Valuation of Municipal Bonds
作者及机构:Preetha Saha, Jingrao Lyu, Dhruv Desai, Rishab Chauhan, Jerinsh Jeyapaulraj, Peter Chu, Philip Sommer, Dhagash Mehta,均隶属于BlackRock, Inc.
发布日期:具体出版日期未明,但数据使用截止2023年11月,回测涵盖2019-2024年时间段
主题:利用机器学习技术(CatBoost)实现市政债券的相对价值评估,通过数据驱动的相似度学习算法对市政债券进行匹配和定价。

核心论点
  • 市政债券市场具有高度碎片化和稀缺交易特性,传统基于规则和启发式方法的相对估值会带来人类偏差,同时难以捕捉债券属性间复杂关联。

- 作者提出一种基于CatBoost的监督式相似度学习算法,利用多输出回归同时针对Options-Adjusted Spread (OAS)和收益率(yield)两个目标变量,实现债券间风险特征的相似度衡量。
  • 基于该相似度,构建债券相对价值评估框架,并通过四年历史回测验证该方法优于传统规则和启发式方法。

- 该方法在实际应用中更能识别风险匹配更精准的债券组,从而提高组合优化和定价的准确性。

总体来看,报告主旨在突破市政债券估值的传统方法弊端,构建一个机器学习驱动、风险敏感且可解释的相对价值模型,并验证其实用性。[page::0,1,2]

---

2. 逐节深度解读



2.1 引言 (Introduction)


报告指出美国市政债券(muni bonds)市场庞大且碎片化,约4万亿美元规模,超过50,000个发行主体存在大量异质性。市场流动性差,交易频率低,50%的市政债一年内交易不超过5天,导致很多债券缺少直接的交易价格信息。[page::0]
传统估值多依赖规则基准或启发式方法,方法简单却难以捕捉债券属性间复杂非线性关系。提出借助机器学习中CatBoost算法,学习风险特征的相似度度量,实现债券价格的相对估值。[page::0]

2.2 相关文献综述与创新 (Previous Works and Contribution)


论文回顾了同类相对估值和相似度学习在企业估值、共同基金及公司债券中的应用,指出之前包含随机森林、梯度提升树以及Kalman滤波等机器学习技术。[page::0]
创新点在于:
  • 采用CatBoost模型,较传统GBDT和随机森林更适合处理大量类别型特征。

- 使用多目标回归同时预测OAS和收益率,更好捕捉关联信息。
  • 提出了新的相似度计算方法,结合树的重要度加权距离,更精准刻画相似性。[page::1]


2.3 方法论 (Methodology)


详细介绍CatBoost算法:一种基于梯度提升的决策树机器学习方法,区别于常规GBDT在于:避免数据泄露的顺序编码、构造对称弱学习树、利用类别特征组合特征进行高效学习等。[page::1]

相似度学习通过计算样本在多个决策树中同落叶节点的频次加权得分,构建局部距离度量。其中,具体定义为:
  • 对随机森林,简单计算所有树中两个实例落叶节点是否相同的比例。

- 对CatBoost,将每棵树的“重要度”Δ_t(与误差减小量成比例)作为权重,计算加权相似度P(i,j)。
  • 多目标回归(Multi-output Regression)通过优化多个目标变量的均方根误差(Multi-RMSE)来学习多维目标的共同预测。[page::1,2]


评价指标涵盖标准回归指标:均方误差(MSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、拟合优度R²。[page::2]

利用SHAP方法提取模型特征重要性,利用合作博弈理论中Shapley值分析特征对模型预测的贡献,有助于模型解释。[page::2]

2.4 相对估值方法 (Relative Valuation Methodology)


债券分组成“generic group”,按照发行州和剩余期限分桶(0-10年分别一年档,10-15年及15年以上单独分组,共12个期限桶)。
基于此粗分组开展相对价值比较,确保群体内债券具有基本可比性。随后通过三种排序方法完成同组内债券价值比较:
  1. 收益率排序:仅依据债券当前收益率由高到低排序,简洁但忽略风险调整。

2. 持续期×利差规则排序(DxS):选最近的k个邻居(DxS最接近),计算债券收益率相对于邻居中位数的溢价,溢价越大则相对价值越大。
  1. CatBoost相似度排序:用模型学习的相似度选出k个最近邻,计算溢价并排序。


后两种涉及风险调整,旨在捕捉更精准的相似债券群体。[page::2]

2.5 回测方法 (Back-testing Methodology)


回测分为多独立6个月周期,在每个时间点T起始阶段1个月内基于交易数据多日采样构建测试集。完成初始排名后,追踪T+1, T+2, T+3, T+6个月后债券收益变化,评估初始排名的有效性(即排名高的债券是否获得高于群体的收益)。[page::2,3]

通过两个指标综合评估排名效果:
  • 初始排名第一的债券是否在未来收益排名前三中占比较高?

- 未来收益最高的债券,是否在初始排名前三中出现?

这两指标加权平均得出回测表现分布,用盒图展示不同k值和时间点表现。[page::3]

2.6 数据说明与模型训练 (Data Description & Computational Details)


使用约22.5万条市政债券数据,过滤高风险和小规模发行,提取22个特征(11类、11数值),目标变量采用内部模型计算的OAS和BVAL价格的收益率。数据预处理包含异常值修正和类别编码,训练数据范围截至2023年11月1日。回测涵盖2019-2024年多个市场周期,包括新冠疫情前后、低利率和波动率环境。[page::3,4]

采用80/20训练测试集划分,20%训练集用于验证和超参优化。超参调整使用Optuna贝叶斯方法,涵盖树数量、深度、叶子数、特征比例、学习率、随机种子等,保证模型泛化和鲁棒性。[page::4]

2.7 实验结果 (Results)


CatBoost相比弹性网、单颗决策树、随机森林,在预测OAS和收益率上均表现优异,验证了其在包含大量类别特征数据中的强大拟合能力。
  • 训练与测试集R²均较高(OAS约0.87,收益率约0.93)

- MAE和MSE显著优于其他模型。
跨多个快照时间点的实验稳定性强,表现一致。[page::5]

SHAP值图表(图1)揭示关键特征对不同目标的贡献:
  • OAS预测:评级(Rating)、剩余期限(Days-to-maturity)、发行主体债券数(Bonds by obligor)影响最大。

- 收益率预测:剩余期限、赎回权选项(Put-Call)和发行主体债券数为主要驱动力。

特征贡献符合市政债券市场认知,且模型解释性较强。[page::4,6]

2.8 相对估值回测结果 (Back-test Results)


七幅盒图(图2a-f)展示2019年至2024年,不同k值(5,10,50,100)和时间月数下三种排序方法的回测表现:
  • 整体来看,相似度模型(Similarity)在多数市场阶段展现最优或接近最优的表现,表现稳定且中位数较高。

- 个别阶段如2023年及2024年类似行情,收益率排序有时表现突出,但风险调整缺失导致波动性较大。
  • 在市场剧烈变动期(如2022年美债利率快速上升),三种方法表现波动大,说明复杂市场中不同策略波动均较明显。

- 类似疫情初期(2020年3月至9月)极端波动市场中,模型相似度排名和简单收益率排序均有效。
  • 规则基准(DxS)方法通常表现偏弱或波动性较大,说明单一指标难捕捉复杂相似性。


结论是基于CatBoost学习的相似度匹配更具鲁棒性和准确性,能够较好识别市政债券中的相对价值,支持风险调整的投资决策。[page::5,7]

---

3. 图表深度解读



3.1 图1:SHAP特征重要性


图1(分为(a)OAS和(b)收益率)展示各特征平均Shapley值及其对预测的正负影响:
  • 右侧颜色显示对应特征的取值高低,暖色调代表高特征值,冷色调代表低特征值。

- 对OAS (a)而言,评级越高(优质)影响负向减少OAS,说明评级对风险定价敏感。
  • 对收益率 (b)而言,剩余期限长度高则收益率更高,赎回权等可选性影响非线性。

- 发债主体集中度(Bonds by obligor)也较重要,符合信用风险集中化理论。

该图辅助理解模型采用的多维非线性关系,提升模型解释能力。
[page::6]

3.2 表5:模型预测性能对比


展示2023-11-01日期快照中4种模型在训练、验证、测试集上的R², MAE, MSE, MAPE。
  • CatBoost测试集R²达到0.87(OAS任务),0.93(收益率任务),远高于ElasticNet和单颗树。

- CatBoost验证集和测试集误差较低,无明显过拟合。
  • 随机森林性能接近CatBoost,但CatBoost对稀疏类别处理更优。


该表佐证CatBoost适合此类多类别混合金融资产回归任务。[page::5]

3.3 表6:时间快照CatBoost性能


展示2019-2023多个年月快照中模型性能稳定,R²均维持0.68~0.89范围,模型在不同市场环境下表现稳健。[page::5]

3.4 图2:回测结果盒图

  • 横轴为回测后1、2、3、6个月时间点,纵轴为联合评估指标百分比。

- 蓝色代表相似度排名,橙色为规则基准(DxS),绿色为单纯收益率排序。
  • 从多个k值角度看,蓝色盒子多数高于橙色和绿色,且分布更集中,显示相似度方法辨识能力较强。

- 不同年份和市场环境下表现差异明显,但一致性指示该模型的广泛适用性。
[page::7]

---

4. 估值分析



报告本质上不直接以绝对估值法(如DCF)进行债券定价,而强调“相对估值”:聚焦债券间的相似度度量,利用模型学习的相似度矩阵,挑选风险特征相近的债券集合,借助这些集合的市场表现和价格信息推测目标债券的合理价值。

具体方法通过CatBoost多输出回归建模债券的OAS和收益率两个核心变量,构建债券间的相似度分数。
然后基于该相似度,计算收益率溢价相对于邻近债券中位数,作为衡量相对价值的指标。
多输出性质则确保两种指标之间的相关信息被利用,避免单一指标可能导致的误判。

此方法避免了传统仅依靠单一规则(如DxS)导致的风险忽略,同时通过机器学习捕捉非线性和高维交互,体现现代智能估值思路。[page::1,2]

---

5. 风险因素评估



报告中未专门章节系统罗列风险,但可从内容推断:
  • 市场流动性风险:城投债交易稀少,日常交易不到2%,价格信息稀缺,导致估值困难与模型训练样本限制。

- 模型风险:模型依赖历史数据训练,未来市场结构突变、无效假设或特征缺失均可能降低预测准确性。
  • 样本选择偏差:数据预处理和过滤可能忽略极端风险债券,限制模型泛化到高风险领域。

- 参数选择及超参风险:尽管采用贝叶斯优化,但超参调节依旧可能导致模型过拟合或欠拟合。
  • 多目标回归难度:OAS及收益率之间假设的稳定相关性如果遭遇市场行为改变,模型性能受损。

- 市场极端事件风险:如2020新冠疫情初期模型仍受较大冲击,短期不确定性可能导致估值误差。

缓解措施包含利用近期交易加权采样、严格交叉验证、采用模型解释(SHAP)监督,未来计划动态改进分组策略等。[page::3,4,6]

---

6. 批判性视角与细微差别



优点
  • 创新性结合多输出CatBoost及相似度学习,克服传统规则方法局限。

- 结构清晰严谨,回测覆盖多市场周期,验证充分。
  • 模型可解释性好,符合金融领域对透明度需求。


潜在不足或争议点
  • 报告中描述的大量过滤和winsorize处理可能导致极端债券样本剔除,影响模型对尾部风险或市场非典型表现的捕捉。

- 相似度定义对树重要度的赋权是否有更优方案值得探讨,当前方法基于残差减少,可能低估后期树结构信息。
  • 回测使用收益率变动作为回报代理,未直接量化绝对收益和风险调整收益,或有遗漏风险收益权衡的细节。

- 报告未详细披露实际训练集及测试集的时间跨度覆盖,未来更详尽的时间验证和滚动窗口分析可能更有指导意义。
  • 全文依赖CatBoost单一模型框架,尽管实验验证了优越性,但未调研更多深度学习或图神经网络等最新方法,可能限制未来发展。


总体来看,报告尊重模型局限,态度谨慎,提出未来研究方向动态分组与原型学习,体现前瞻性。[page::2,4,5,6]

---

7. 结论性综合



本报告围绕美国市政债市场隔夜现金流稀缺和债券异质性难题,提出基于机器学习的债券相对估值新框架。核心贡献点及发现如下:
  • 利用CatBoost实现多目标回归,联合预测债券的OAS与收益率,有效结合收益与风险两个衡量维度。

- 基于CatBoost训练过程中决策树的叶节点共同出现情况引入新的相似度定义,捕捉债券间细粒度风险特征相似性。
  • 债券以发行州和剩余期限分组,构建“generic group”,结合模型学习相似度构建更精准统筹的债券邻居集,打破传统单因素规则约束。

- 回测期间覆盖五年多轮不同利率与市场周期,模型基于相似度的排序策略普遍优于简单收益率排序和基于DxS的规则排序。
  • SHAP解释分析显示评级、期限及债券发行主体在模型中贡献最大,验证金融领域理论基础。

- 模型验证集和测试集均表现稳健,CatBoost相比传统弹性网、单颗决策树和随机森林均能持续保持较高精度。
  • 未来方向包括改进分组方式,更灵活动态打造债券“原型”和多维相似度分组,以适应市场变化。


综上所述,本研究不仅提出并验证了一种创新性的市政债券相对估值模型,而且从数据科学角度强化了市政债券价格发现的精细化和结构化,有望在实践中有效助力投资组合构建和债券定价,提升投资效率和风险管控水平。[page::0-7]

---

参考报告图表


  • 图1:SHAP特征重要性图,具体展示了不同特征对OAS和收益率预测的影响程度和方向。


  • 图2:2019至2024年六个回测窗口中,不同k值下三种排序方法的回测表现盒图,清晰展现相似度方法普遍领先优势。



---

总结语



本报告堪称将先进机器学习技术与市政债券相对价值分析有机融合的典范,通过多目标CatBoost模形和创新相似度定义成功实现了债券价格的风险调整相对估值。丰富的实证结果和模型解释能力表明,该方法在投资实务中具备良好的应用潜力与前景,值得投资者和研究者深入关注与推广。

[page::0,1,2,3,4,5,6,7]

报告