利率曲线: 可预测与不可预测的成分 宏观固收量化系列研究之(一)
创建于 更新于
摘要
本报告基于中债国债和国开债历史数据,采用Nelson-Siegel模型构建利率曲线,结合主成分分析及高斯仿射无套利模型,深入探讨利率曲线的可预测性。实证显示,利率曲线短期(3、6个月)变动难以预测,长期(1年)变动具备部分预测能力,且机器学习方法优于线性模型,真实世界的VAR模型优于风险中性框架的G-ATSM模型。报告提出利用关键期限零息债券复制投资组合,通过预测债券风险溢价来辅助利率债组合收益率的分析,实证验证模型在一年期收益预测上的有效性,但短期利率数据的质量仍制约短期预测准确性,未来研究聚焦于短端利率市场化改进 [page::0][page::3][page::5][page::6][page::7][page::9][page::13][page::15][page::18][page::21]
速读内容
利率债市场概览与数据统计 [page::3][page::22][page::23][page::24][page::25]
- 我国债券市场历史近40年,国债和国开债是关注重点。
- 同业存单发行规模快速增加,金融债交易活跃度高。
- 国债和国开债的发行与交易额主要集中在1、3、5、7、10年期限。
- 各期限国债和国开债发行、交易统计详见附录数据表。
利率曲线构建方法及主成分分析 [page::5][page::6][page::7][page::8]
- 采用Nelson-Siegel模型描述即期利率曲线,参数具有经济含义,对应利率曲线的平均水平、斜率和曲率。
- 历史主成分分析前三个主成分能解释99%以上利率曲线波动,且对应NS模型参数。
- 高斯仿射无套利模型尝试从风险中性角度构建利率期限结构,但国内市场短端利率与无套利模型偏差明显高于美国市场。




利率曲线短期难预测,长期预测有部分显著性 [page::13][page::15][page::16][page::26][page::27][page::28]
- 利率曲线前三参数及关键期限利率变动的3个月及6个月预测效果较差,多模型预测表现不显著优于随机游走。
- 长期1年期预测中,VAR和机器学习模型xgboost表现较好,且相较无套利G-ATSM模型效果明显更佳。
- IVX-CP模型在线性预测上效果一般,加入NS模型参数与滞后量后表现变差。
- 统计显著结果主要体现在长期平行移动参数a_t及部分期限利率。

债券风险溢价(BRP)的预测及应用 [page::13][page::18][page::19][page::20][page::30]
- 短期(3、6个月)BRP不可预测,主要由于市场短端即期利率数据质量不足。
- 1年期BRP预测较为有效,部分模型显著超越随机游走。
- 通过复制投资组合匹配久期和凸性,利用关键期限零息债券BRP预测国内国债1-3年、3-5年、5-7年财富指数未来1年收益。
- 预测模型在历史大事件冲击时表现偏差大,但整体具有较高方向准确率及显著的预测信息。



结论与风险提示 [page::0][page::21]
- 利率曲线虽包含市场对未来经济、通胀及资金面的预期信息,短期内难以有效预测,长期存在部分可预测成分。
- 机器学习与真实概率测度VAR方法预测效果优于经典风险中性无套利模型。
- 建议投资者关注BRP及其复制投资组合分析,短期预测仍依赖于改善市场短端利率数据质量。
- 存在量化模型失效风险及市场极端冲击风险,需审慎使用模型成果。
深度阅读
利率曲线:可预测与不可预测的成分——宏观固收量化系列研究解读
---
一、元数据与报告概览
- 报告标题:《利率曲线:可预测与不可预测的成分》(宏观固收量化系列研究之一)
- 作者及机构:证券分析师 朱剑涛,东方证券研究所
- 报告发布日期:2019年12月8日
- 研究主题:重点围绕中国国债和国开债的利率期限结构,深入解析利率曲线的构建、分解及未来变动的预测能力,探讨其在债券估值与投资组合管理中的应用。
- 核心论点及目标:
- 利率曲线是市场交易反映出的价格组成,隐含投资者对未来经济增长、通胀及资金面的预期信息;
- 通过Nelson-Siegel模型提取利率曲线的主要参数(平均水平、斜率、曲率),捕捉绝大部分信息,便于分析和预测曲线变动;
- 国内债市存在无套利条件不完全满足的问题,导致无套利模型(如G-ATSM)在实践中拟合效果不佳;
- 利率曲线短期变动难以准确预测,长周期(约一年)变动存在一定预测价值;
- 非线性机器学习模型优于传统线性模型,现实测度下的预测模型优于风险中性测度模型;
- 对债券组合市场价值的预测效果良好,但仍受限于短端利率数据的不足;
- 明确模型风险与市场极端冲击风险。
该报告旨在为投资者提供构建和利用利率曲线预测工具的框架指导,提升投资组合风险管理和收益预测能力。[page::0],[page::21]
---
二、逐节深度解读
2.1 利率债市场概览
报告首先回顾了中国债券市场近40年的发展脉络,明确利率债市场结构和主要品种的发行与交易情况。从多年的数据统计看:
- 发行量上,同业存单因银行需求和会计制度红利,于2015年后快速增长,发行规模超过金融债、地方债和国债总和;
- 交易量表现活跃的为金融债,其成交量在2019年前9个月达73.18万亿,是国债成交量的三倍以上;
- 国债及国开债各期限发行和交易均较活跃,特别是在1、3、5、7、10年期限;
- 投资者分为配置户和投机户,新券(流通盘较大)的成交活跃度明显高于旧券,利率债的流动性随着上市时间呈明显衰减趋势,但国开债中10年期显示出上市后3至6个月成交量高企特征(图1);
- 这些基本统计为后续利率曲线建模和参数估计提供了必要的市场基础认识。[page::3],[page::4]
2.2 利率曲线构建
- 即期利率与零息债券: 因债券品种多样,价格差异大,直接比较困难,故利用到期收益率,但到期收益率同期限债券间差异使其不唯一。零息债的即期利率最适合定价,但这些只在部分期限由财政部零息国债直接观察,长端即期利率多用数学方法从附息债券市场价格推算;
- Bootstrap方法和插值难题:经典的bootstrap方法需债券付息和到期日坐标固定,实际债券时间零散,需插值补足,插值方法选择带来的主观性,影响曲线拟合;
- 参数化模型选择:
- 三次多项式:局部拟合优,但缺乏经济含义,长端利率随期限趋向无穷大不符合常理。
- Nelson-Siegel (NS)及其Svensson扩展模型:参数直观,光滑性好,较适合宏观调整分析。
- 国内利率曲线输入数据局限:中债利率曲线采用Hermite三次多项式拟合,去除价格数据中的异常,但仍包含大量专家估值及柜台报价,不免有误差影响定价功能;
- 无套利假设限制:国内债市缺乏纯零息债券及本息剥离工具,市场离无套利模型假设较远,市场价格和模型价格偏离显著,导致无套利模型(G-ATSM)拟合误差远高于美国市场,特别是短端利率误差甚大;
- BIS 2005调查显示美国偏好多项式样条,欧洲多用NS模型,国内市场状态则存在特殊性需关注模型适用边界。[page::5],[page::6],[page::11]
2.3 利率曲线主要变动成分分析
- 使用主成分分析(PCA)对即期利率期限序列进行降维,发现前三大主成分解释国债利率曲线波动方差高达99.4%:
- 第一主成分(LEVEL):平行移动,所有期限利率基本同方向变动;
- 第二主成分(SLOPE):代表长短端利差,曲线斜率变动;
- 第三主成分(CURVE):表现中短端曲线形态的曲率变动,作用极小(0.7%);
- 类似于NS模型三个参数的经济意义对应:
$$ at \leftrightarrow \text{LEVEL},\quad bt \leftrightarrow \text{SLOPE},\quad ct \leftrightarrow \text{CURVE} $$
利率曲线可通过这三个因子参数在时间序列上的变化进行分析和预测(图3-图8)。
- 对国开债曲线分析显示LEVEL变动幅度大于国债,反映出流动性和税收影响。[page::7],[page::8],[page::9],[page::10]
2.4 Nelson-Siegel 模型实证
- NS模型以三参数+固定λ的形式对利率曲线即期利率进行拟合,取得了较好的拟合效果(图7),尤其是在中长期期限;
- 短端拟合误差较大,可能与市场数据扰动相关,不代表模型缺陷;
- 三参数随时间变化趋势(图8)提供了可供后续时间序列预测与投资分析的重要信息载体。[page::9],[page::10]
2.5 高斯仿射利率期限结构模型(G-ATSM)
- G-ATSM纳入市场无套利条件,通过多因子VAR模型对市场状态变量(主要为利率曲线主成分)建模,结合风险中性与真实概率测度;
- 模型复杂程度和适用性高,适合做市场套利均衡定价;
- 但是,国内市场因流动性和品种限制,距离无套利理想状态较远,导致G-ATSM与实际市场利率曲线偏差较大(图9显示偏差多数在数十bps,短端甚至超过150bps),不宜直接据此报价和风险管理;
- 相比美国等成熟市场,国内市场套利机制和金融工具缺乏是主要限制;
- 估计参数时采用的是Adrian(2013)提出的高效方法,选取前三主成分为状态变量,既控制模型复杂度也兼顾统计显著性。[page::11],[page::12]
---
三、图表深度解读
图1 — 国债与国开债的上市单券成交额衰减
- 该图展示国债与国开债不同期限债券上市后的月度单券日均成交额,说明流动性随着债券存续时间延长趋势性衰减;
- 国债成交额下降较为平稳,国开债则在新上市3-6个月内(尤其10年期)出现成交活跃度峰值;
- 体现了投机户参与新券交易的流动性需求,指导定价及估值应重点关注新券市场表现[page::4]
图2 — 历史平均利率曲线(2007-2019)
- 展示国债与国开债平均即期利率曲线,国开债利率普遍高于国债约50bps,符合市场对流动性和税收的补偿要求;
- 曲线呈单调上升,符合正常期限利差逻辑;
- 曲线连续且光滑,适合基于参数化模型分析[page::7]
图3-6 — 国债及国开债利率曲线前三主成分及对应系数
- 分别展示LEVEL、SLOPE、CURVE三主成分随时间变化和各期限上对应的加载系数;
- LEVEL平行移动且波动最大,SLOPE与CURVE变化较小,CURVE特别微弱;
- 图5和图6的曲线系数呈现NS模型中b
- 反映利率曲线主要波动由平移,次由斜率变化驱动[page::8]
图7 — NS模型拟合例证
- 四个典型交易日,中债即期利率曲线与NS拟合曲线叠加;
- 拟合曲线平滑,短端离散点和曲线差异最大,长期整体现象良好;
- 验证NS模型使用合理,特别适合时间序列预测[page::9]
图8 — NS模型参数时间序列
- a
- 参数序列用于VAR和机器学习建模,提高预测准确性[page::10]
图9 — 无套利模型与中债即期利率曲线误差
- 各期限的误差具体值为国债市场中债即期利率与基于G-ATSM无套利模型拟合利率之间MAE(bp);
- 误差明显大于美国市场(美国一般小于1bp),短端0.25年误差高达158bp;
- 充分体现国内债券市场无套利假设的偏离与商品市场限制[page::12]
表4 & 表5 — 国债和国开债利率曲线一年后变动预测
- 对比不同模型对NS参数和关键期限利率一年期变化的样本外预测优劣;
- 机器学习xgboost模型在预测关键期限利率时多呈现正的样本外R²,且部分显著优于随机游走基准;
- 传统IVX线性模型及加权VAR模型表现一般,G-ATSM模型由于无套利假设局限预测能力较差;
- 方向命中率多在60%以上,证明模型在趋势识别方面具备一定稳定性[page::16],[page::17]
表6 — 国债BRP持有期6个月和12个月预测
- BRP长期(12个月)相较短期(6个月及以下)更具预测价值;
- 持有期6个月以下的BRP预测均无显著能力,部分可能受短端利率测算误差影响;
- 机器学习模型与VAR模型在12个月BRP预测显示较优表现[page::18]
图11 — IVX模型BRP预测示例
- 展示基于IVX-CP模型预测的5年期BRP与真实值对比趋势,预测曲线能较好捕捉BRP的波动,证明其长期趋势识别能力[page::19]
图12、13 — 利率债财富指数复制组合权重
- 分别展示1-3年和5-7年国债总财富指数对应的零息债券复制组合权重;
- 通过选择3个期限不同的零息债券,实现久期和凸性匹配;
- 权重随时间动态调整,反映了收益率曲线结构变化及组合优化需求[page::19]
图14 — 利率债财富指数一年收益率预测
- 以BRP预测结合零息债券复制策略模拟国债财富指数收益率,预测曲线与真实收益呈较好匹配;
- 极端事件如2013年“钱荒”期间模型预测偏差明显,反映模型在特殊市场冲击下的局限性[page::20]
---
四、估值与预测模型分析
利率曲线建模方法比较
- Nelson-Siegel模型:
- 参数化,使用三个主参数(a,b,c)和固定λ;
- 参数含义明确,拟合效果稳定且与利率主成分对应;
- 适用于整体曲线趋势的提取和预测。
- 高斯仿射多因子模型(G-ATSM):
- 理论基础扎实,满足无套利条件,基于风险中性定价;
- 结构复杂,参数估计需要大量数据和算法工具;
- 国内市场适用性受限,拟合误差较大。
- 无套利模型与非无套利模型比较:
- 实证显示国内债市偏离无套利状态较严重,模型应结合实际市场特征调整;
- 现实世界(P测度)模型预测优于风险中性(Q测度)模型。
利率曲线预测方法
- 总体目标是预测NS模型的三个参数,间接预测整条利率曲线;
- 比较包括IVX-CP线性模型、xgboost机器学习模型、IVX-CP+YC扩展模型、VAR模型和G-ATSM;
- 主要评估指标为样本外R²和方向正确率;
- 结果表明:
- 利率曲线短期变动难以预测,长期(如1年)可获得有限预测能力;
- xgboost模型表现突出,能捕获非线性关系;
- 引入滞后问题相关参数并未明显提升预测质量;
- VAR模型在现实测度下优于基于无套利假设的G-ATSM模型。
债券风险溢价(BRP)
- BRP定义并计算方法详述,连接理论风险溢价与投资实际收益;
- BRP短期预测难,但持有期长达一年时可取得较好预测;
- 预测BRP结合零息债券复制组合能够对实际国债组合收益率提供预测,为投资组合管理提供工具;
- 建议进一步寻找可靠短期即期利率以提升短期预测能力。[page::13],[page::14],[page::15],[page::18],[page::19],[page::20]
---
五、风险因素评估
- 量化模型失效风险:基于历史数据,模型未来可能因市场结构、宏观环境变化失效。
- 市场极端环境冲击风险:如2013年钱荒、2015年股灾事件所示,极端波动事件导致模型预测偏差较大。
- 无套利假设偏离:国内债市套利机制不足,导致无套利模型估值偏差较大,风险管理需警惕。
- 报告提醒关注数据质量与流动性不足可能带来的误判风险。[page::0],[page::21]
---
六、批判性视角与细微差别
- 报告恰当指出国内市场无套利假设偏离严重,实务中应谨慎采用纯无套利模型;
- 利率曲线短期波动预测难,提示投资者避免过度依赖短期数字模型决策;
- 机器学习模型表现优于传统模型,但模型黑箱性尚未充分披露,风险管理需额外警惕过拟合及外推风险;
- 利率曲线主成分解释对设计模型有效,但预测阶段CURVE及斜率参数表现不佳,需进一步完善模型;
- BRP预测受限于短端利率测量误差,暗示市场发展及数据质量提升需求巨大;
- 极端事件周期样本外预测表现差,是模型局限性的体现。
- 使用扩张窗口、重叠样本的预测方法可能高估R²,报告对此已有说明,但仍需在使用时谨慎评估其统计意义。
- 报告的投资组合复制策略局限于久期和凸性匹配,未涵盖利差久期,提示后续继续扩展。[page::13],[page::15],[page::21]
---
七、结论性综合
该报告系统分析了中国债券市场的利率曲线构建、主要成分解析及其预测能力,提出了基于Nelson-Siegel模型的三参数框架捕获绝大部分利率曲线信息,在实际市场中主成分LEVEL和参数a_t尤为关键。实证发现利率曲线短期波动极难准确预测,但一年期展望下存在部分机会,尤以机器学习与VAR模型表现较好。无套利模型由于市场微观结构限制,拟合误差较大,在实际投资应用中效果不佳。以债券风险溢价(BRP)作为分析对象,通过零息债券复制策略对国家债券财富指数进行收益率预测,取得良好的样本外表现,显示BRP预测或许是比直接预测利率曲线更实用的途径。
报告提供了详尽的数据统计与图表,充分展现出当前利率曲线在中国市场上的统计特征、模型拟合精度和预测能力(图1至图14,表1至表15),为后续利率债投资与风险管理工作提供了实证和模型基础。鉴于市场短期利率数据的缺乏与噪音,特别强调短端利率市场化建设的紧迫性。报告同时提示量化模型风险和极端事件冲击风险,呼吁投资者理性应用量化工具,以辅助把握利率期限结构动态并优化债券组合投资。
整体上,报告立场客观、中肯,努力结合国际先进方法与中国债券市场实际,推动固收量化研究的深入发展,推荐投资者关注基于NS模型的参数变动及BRP走势作为投资决策的核心参考指标。[page::0],[page::21],[page::31]
---
参考图表附件示例
- 图1:国债和国开债单券成交额衰减趋势

- 图2:历史平均利率曲线(2007-2019)

- 图3:国债收益率曲线前三主成分数值变化

- 图7:中债利率曲线与 NS 拟合曲线

- 图9:无套利曲线与中债即期利率平均绝对值偏差(bps)

- 图14:国债总财富指数未来一年收益率预测


---
通过上述全面系统的解构和深入分析,报告为债券投资者和分析师提供了极具价值的利率曲线定价及预测工具,并提出了中国市场特色与未来研究方向,具备较高实用价值和理论参考意义。