`

债券量化系列之二:债券组合量化策略研究

创建于 更新于

摘要

本报告系统研究目标久期下的债券收益率曲线量化策略,重点分析蝶式组合的构建方法及其收益特征,结合机器学习模型(Lasso、随机森林、AdaBoost、XGBoost)对蝶式组合收益进行预测。实证发现,XGBoost模型在测试集上具备最佳收益率解释能力和较优综合表现,蝶式套利策略年化收益在1.0%-1.7%之间,基于蝶式利差信号构建的哑铃子弹型组合多头配置策略则实现在测试集4.2%-4.6%的年化收益,相较等权基准具有显著提升。报告同时深入利率曲线因子风险敞口与模型拟合的实际误差,对风险与模型过拟合问题做出提示 [page::0][page::4][page::6][page::9][page::14][page::16][page::18][page::19]

速读内容

  • 债券组合量化策略介绍 [page::4]

- 介绍三种目标久期债券组合结构:子弹型、哑铃型及阶梯型组合。
- 蝶式组合多采用现金中性赋权,关注利率曲线水平、斜率、曲率因子风险敞口。
  • 蝶式组合风险敞口及历史表现 [page::5][page::6]

- 蝶式组合两翼久期与躯干久期约为4.13年,凸性较高的组合收益相对较优。
- 蝶式组合平均月度收益为负,表现震荡但有利于利益于曲线变平和凸性增加。


  • 活跃券组合筛选标准与收益趋势 [page::7][page::8][page::9]

- 建立2Y、5Y、10Y活跃券组合,依据国债期货交割券规则,以20日成交量筛选。
- 活跃券组合全收益指数稳步上涨,久期波动相对跟踪中债国债指数。



  • 利率曲线三个因子对蝶式组合影响的情景分析 [page::10][page::11][page::12]

- 利率曲线水平因子影响较小,蝶式组合对曲线变平(斜率因子)极度敏感,且显著受益于凸性因子变化。



  • 利率曲线NS模型拟合分析与蝶式组合预测建模思路 [page::12][page::13]

- NS模型拟合存在一定误差,尤其是高阶曲率因子,直接基于因子预测蝶式收益误差较大。
- 采用直接预测活跃券蝶式组合收益率的思路,选取市场及组合相关指标做解释变量。


  • 量化因子与模型构建 [page::14][page::15][page::16]

- 设计276个多源特征因子,包括活跃券收益率、蝶式组合指标、NS因子及远期利率,进行多种时序变换和标准化。
- 以Lasso、随机森林、AdaBoost、XGBoost四种模型建模,通过交叉验证及超参数调优完成训练。


  • 模型表现评价 [page::16][page::17]

- XGBoost测试集预测解释能力(R2)最高(5.2%),随机森林预测差异最小,Lasso胜率与盈亏比表现较佳。



  • 蝶式套利策略净值与绩效 [page::18]

- 测试集四模型年化收益介于1.0%至1.7%,夏普比率最高达2.08,最大回撤均小于1%,表现稳定。

  • 基于蝶式策略的多头组合轮动策略 [page::19][page::20]

- 以蝶式组合信号指导哑铃/子弹组合多头配置,测试集年化收益4.2%-4.6%,显著优于等权基准3.7%。
- 全样本数据显示年化收益4.3%-4.8%,夏普比率均超2.5,最大回撤有较好控制。


  • 风险提示 [page::0][page::21]

- 量化模型基于历史数据,未来存在失效风险,投资者需关注模型过拟合和市场结构变化风险。

深度阅读

债券量化系列之二:债券组合量化策略研究 — 详尽分析报告



---

一、元数据与概览



报告标题: 债券量化系列之二:债券组合量化策略研究
作者及联系方式: 王冬黎,高级分析师(金融工程),联系方式:dongli.wang@orientfutures.com
发布机构: 上海东证期货有限公司,东方证券全资子公司
发布日期: 2022年3月21日
研究主题: 本报告围绕目标久期下的债券收益率曲线策略展开,重点研究蝶式组合的构建、收益预测模型及基于蝶式策略对于债券多头组合的配置方案,探索机器学习决策树模型在债券量化领域的应用。
核心论点:
  • 对哑铃型组合与子弹型组合针对目标久期展开收益比较分析。

- 基于四种模型(Lasso、随机森林、AdaBoost、XGBoost)进行蝶式组合收益率的预测,其中XGBoost预测表现最优。
  • 采用预测信号指导债券组合的多头配置,达到提升收益风险比的效果。

- 强调蝶式组合的风险暴露特征与整个策略的风险提示,提示模型基于历史数据,有失效风险。

报告不仅提供传统债券投资组合策略的回顾,还融合先进机器学习算法对蝶式组合进行收益率预测,为投资组合构建提供量化模型支持。最后结合实证测试,四个模型均实现正回报且夏普比率表现良好,说明策略有效[page::0,4,18,21]。

---

二、逐节深度解读



1. 债券组合策略



1.1 债券组合类型介绍与实现



报告简要回顾了三类目标久期债券组合类型:
  • 子弹型组合(Bullet): 投资集中在收益率曲线某一特定久期点。

- 哑铃型组合(Barbell): 投资集中在收益率曲线短端与长端,形成两个极端久期敞口。
  • 阶梯型组合(Ladder): 分散配置于长中短久期债券,追求久期均衡以及收益分散。


子弹型和哑铃型关注点不同,哑铃型通过长短债权重调配实现目标久期,适于利率策略多空,阶梯型为控制交易成本的对照基准,不参与轮动策略[page::4]。

1.2 蝶式组合构建方式



蝶式组合是目标久期配置中重要的量化工具,旨在捕捉收益率曲线的凸性及中间期限收益变化,报告重点在于四种权重配置方法:
  • 现金中性(Cash-Neutral): 两翼仓位市值相等,适合现券市场,轻微正向暴露于水平因子。

- Fifty-fifty赋权: 两翼现金久期等权,中性对应曲线长短端等额变化。
  • 回归赋权: 基于长端、中端及短端利差历史波动回归确定权重,平衡长短端常规变化幅度。

- 到期日赋权: 权重根据债券到期时间比例调整,适合捕捉期限相关利率波动。

报告最终采用现金中性蝶式组合,因为贴合现券市场实证,方便结合多头配置策略[page::4,5]。

1.3 蝶式组合的历史表现——活跃券组合



报告利用2年、5年、10年活跃券构建子弹型、哑铃型及蝶式组合,活跃券池基于国债期货可交割规则和流动性标准构建,保证高频换手与流动性。基础统计发现两翼债券久期权重比约1.3:1,躯干和两翼平均到期收益率约3.18%与3.13%。高久期债券凸性明显大于中低久期债券,符合债券凸性溢价理论。蝶式组合月度收益均为负,累计收益呈持续下行趋势,但波动力较大,表明凸性交易收益难以持续获利,但仍提供利用曲线变平的机会。子弹与哑铃型组合收益率利差存在正均值回复,指示均值回归关系为量化择时机会[page::5,6,7]。

1.4 活跃券组合构建补充说明



详细说明了活跃券筛选规则:针对2年、5年、10年期限段,依据发行年限和剩余期限筛选,基于20日平均成交量取前3个高流动性品种构建等权组合,组合以月度调仓,票息按月结转。此方式确保组合流动性和实际可交易性,避免使用流动性较差的指数品种[page::7]。

---

2. 蝶式组合影响归因



2.1 利率曲线因子暴露与情景分析



基于Nelson-Siegel(NS)模型及其衍生(Diebold-Li)方法,报告系统构建了对蝶式组合的因子暴露度。收益率曲线用水平(Level),斜率(Slope)与曲率(Curvature)三个因子表达,蝶式组合对每个因子的现金久期暴露可用NS因子偏导数计算。实证显示蝶式组合久期中性,对水平因子暴露极小,对斜率因子负相关(受益于曲线趋平),对曲率因子具有较大风险敞口,这是蝶式策略获得凸性溢价的重要来源[page::9,10]。

2.2 利率曲线变化的情景分析



实证选取代表久期债券(2.15年,4.32年,8.21年),构建权重0.64:-1:0.36的蝶式组合,探索水平、斜率、曲率因子变化对收益影响。关键发现:
  • 水平因子移动对蝶式组合收益影响小,反映出蝶式组合久期中性和凸性溢价。

- 蝶式组合显著受益于曲线趋平(斜率因子减少),此特征在即时至1个月持仓期内影响一致。
  • 蝶式组合对曲率因子高度敏感,凸性变化直接影响收益,策略核心即是捕捉曲线凸性交易机会。


多时点持仓分析结果支持蝶式组合作为捕捉收益率曲线非线性结构的有效工具[page::10,11,12]。

2.3 利率曲线NS模型拟合状况



通过对中债国债收益率曲线拟合,报告发现NS模型拟合整体良好,但曲率因子噪声较大,估计误差明显且波动异常。曲率因子高频表现波动大,直接以其预测策略存在较大误差,可能导致蝶式组合收益率预测结果不稳。故报告选择直接预测蝶式组合活跃券收益率,绕开单纯依靠收益率曲线因子预测的限制,增强模型鲁棒性[page::12,13]。

---

3. 蝶式组合多空策略建模与表现



3.1 模型解释变量说明



报告选用276个特征变量,涵盖四大类:
  • 活跃券组合指标(到期收益率、收益率利差、曲率等)

- 蝶式组合自身相关收益率及利差
  • NS模型3因子(水平、斜率、曲率)

- 远期利率曲线各区间利率

所有变量均以原始值及多种时序运算(差分、滚动窗口ZSCORE、波动率指标等)进行处理和标准化,以挖掘潜在特征信息[page::14]。

3.2 模型构建



基于8:2比例划分训练和测试集,采用以下模型:
  • 线性降维模型Lasso:通过特征筛选避免过拟合,双重交叉验证(特征筛选与调参)

- 决策树模型:随机森林(Random Forest)、AdaBoost、XGBoost,自动特征选择,重点超参数调优

各模型均基于滚动窗口剔除异常值和缺失数据处理,充分利用历史样本进行模型训练。随机森林和梯度提升类模型分别评估其灵活性的同时控制过拟合风险[page::15]。

3.3 模型效果分析



以解释力R²、预测方向胜率HIT、盈亏比PL三项指标评价模型表现(均在训练集与测试集分别对比):
  • R²预测解释力: 测试集表现最好的是XGBoost (5.2%),最差的是Lasso (1.0%)。随机森林较为稳健,测试集与训练集差异小,AdaBoost模型测试表现退化较明显,或存过拟合风险。

- 预测方向胜率HIT: 测试集随机森林表现优异(57.9%),XGBoost次之,Lasso表现一般。
  • 盈亏比PL: 测试集Lasso表现最佳,说明其在盈利时获得较高收益且亏损较小。


四个模型各有利弊,综合来看XGBoost预测能力最好,随机森林稳定性高,Lasso盈亏比优势明显[page::16,17]。

3.4 蝶式策略净值表现



基于策略的测试集表现:
  • 年化收益率介于1.0%-1.7%之间(最高为Lasso)

- 夏普比率均大于1,最高2.08(Lasso)与1.84(XGBoost)
  • 最大回撤均小于1%,风险控制优秀


全样本测试表现略有提升,XGBoost年化收益最高达到2.3%。总体收益表现稳定,模型间表现差异不大,AdaBoost略显落后,推测如前所述存在过拟合风险。净值走势图显示均优于均权蝶式基准[page::18]。

---

4. 基于蝶式策略的债券组合多头配置



将蝶式组合套利信号转化为哑铃型与子弹型组合的多头配置策略:若蝶式组合信号为正,则仓位增加哑铃组合,反之仓位转向子弹组合。此策略整合了蝶式组合对利率曲线形态的洞察,灵活调整久期结构。

测试集配置策略结果表现优异,年化收益介于4.2%-4.6%,最大回撤-2.6%至-3.1%,夏普比率提升至约2.4-2.7区间,明显超越同期均权基准(年化约3.7%,最大回撤-3.5%),风险调整后的收益显著增加[page::19,20]。

---

5. 风险提示



报告明显提示所有量化模型的有效性基于历史数据估计,不排除在未来失效或表现不佳的风险,提醒投资者谨慎使用。此外,蝶式组合策略对曲率因子的依赖表明市场利率曲线的非线性变动将对收益率有重大影响,预测误差可能对策略结果带来波动[page::0,21]。

---

三、图表深度解读



图表1 蝶式组合常用构建方案(第5页)


  • 展示四类蝶式组合权重计算公式及其对利率曲线三级因子(水平、斜率、曲率)暴露特征。

- 现金中性方案对水平因子中性,受益于曲线变平,契合实证现金流投资需求。
  • 其他方法关键在于对斜率因子敞口的不同调控,体现不同策略偏好。

- 提示策略选择权重需结合投资实际和预期风险曝光设计。

图表2 蝶式组合风险敞口统计(第6页)


  • 主要对躯干和两翼债券久期、到期收益率、凸性进行均值统计。

- 显示两翼债券凸性显著高于躯干(30.01 vs 21.78),高凸性债券到期收益率略低(3.13% vs 3.18%),符合凸性溢价理论。
  • 躯干和两翼久期均约4.13年,权重比例约1.3:1,体现策略对久期控制的精准调节。

- 该数据基础为蝶式策略构建风险管理和收益评估提供精准量化指标。

图表3-4 蝶式组合月度收益及累计收益趋势(第6页)


  • 图3显示蝶式组合大多数月度收益为负,部分月份出现显著负收益,波动较大。

- 图4累计收益随时间呈逐步下滑趋势,累计收益净值从1减至约0.97,暗示蝶式交易长期净损,短期有获利可能。
  • 结合风险指标表明蝶式组合收益来源于市场结构变化及短暂套利机会,而非稳定收益。


图表5-6 子弹型与哑铃型组合收益率分析(第7页)


  • 图5收益率利差波动于-0.4%至+0.4%区间,呈现均值回复特性。

- 图6显示两种组合收益率走势高度同步,均受到宏观利率环境影响。
  • 该均值回复特性为债券久期轮动与组合配置提供博弈空间。


图表8-13 活跃券组合收益指数与久期(第8-9页)


  • 各期限活跃券组合与中债指数收益指数走势高度吻合,确保组合投资的市场代表性和流动性。

- 久期方面,活跃券组合表现出较稳定的久期时间,偶尔波动但总体在目标区间内波动,支持久期控制策略实施。

图表15-20 利率曲线因子对蝶式影响及情景分析(第11-12页)


  • 水平因子变动对蝶式组合影响为U型曲线,较小波动收益不显著,斜率因子与组合收益呈线性正相关,曲率因子对收益有显著正效应且坡度最大。

- 持仓时期对因子影响略有衰减,但结构一致,说明策略持仓期间收益弹性受限于曲线高阶形态。

图表21-24 NS模型拟合与因子比较(第13页)


  • NS模型曲线与离散利率较为贴合,拟合误差不明显,但曲率因子波动较大且误差明显,回归分析显示组合收益与NS模型斜率因子存在较好相关性,曲率因子相关性较弱。

- 说明单靠NS模型因子估计难以精确捕捉蝶式组合复杂收益结构,需辅助直接收益预测模型。

图表28-31 模型性能比较(第16-17页)


  • R²最高者为XGBoost,训练测试差异也较合理,随机森林次之,AdaBoost训练高但测试显著下降,显示过拟合风险。

- 随机森林HIT最高,有利于准确方向预测,Lasso盈亏比最优,说明策略中盈利时收益幅度较大。
  • 图形直观展示了各模型在拟合能力、稳定性及方向预测能力上的优劣。


图表32-35 蝶式套利策略净值表现(第18页)


  • 净值曲线显示各模型均优于基准且表现稳定,Lasso年化收益最高但婉转性生活较大,XGBoost夏普比率高,风险调整后更优。

- 最大回撤均小于1%,表现出较低风险特征。

图表36-39 债券组合多头配置净值表现(第19-20页)


  • 组合轮动策略实现年收益4.2-4.6%,最大回撤约-3%,均高于均权基准。

- 夏普比率显著提升(约2.4-2.7),Calmar比率亦得提升。
  • 净值曲线平滑上升,表现稳定且收益风险比明显改善。


---

四、估值分析



本报告非传统意义评估公司价值的估值报告,核心为策略表现与收益率预测模型评估。模型间通过解释力(R²)、胜率(HIT)、盈亏比(PL)及策略绩效指标(年化收益、夏普比率、最大回撤等)系统对比,且融合机器学习的特征选择、交叉验证和参数调优技术确保模型稳定性和防止过拟合,通过实证测试对模型可靠性进行检验,XGBoost在综合表现上略优,随机森林表现稳健,Lasso偏向稳健型策略[page::16-18]。

---

五、风险因素评估


  • 量化模型失效风险: 强调模型基于历史样本估计,未来金融市场结构变化或异常波动可能导致预测失效。

- 收益率曲线建模误差: NS模型对曲率因子拟合误差较大,导致蝶式组合收益预测不够精确。
  • 交易成本与流动性风险: 策略依赖活跃券组合,强调流动性选择避免交易冲击,但仍不可完全排除流动性约束。

- 过拟合风险: AdaBoost模型表现出明显过拟合风险,决策模型需谨慎调参以避免数据拟合过度。
  • 策略适用市场环境限制: 蝶式套利效果依赖利率曲线变动特征,极端市场环境影响策略实效。


报告未给出具体缓解策略,但通过多模型比较和稳健性评估,尝试降低上述风险影响[page::0,12,16,21]。

---

六、批判性视角与细微差别


  • 报告重视机器学习模型的比较,避免单一模型盲目应用,体现较为谨慎和科学的研究态度。

- 曲率因子的建模误差被明确指出,是全文策略设计的关键风险点,提示读者需谨慎解读蝶式组合收益预测。
  • 现金中性蝶式构建方法虽然合理,但并无足够论证为何舍弃其它权重方法,仅表示后续会探讨衍生品方向,显示当前报告重心在实证验证。

- 模型测试集效果与全样本效果的差异揭示复杂模型潜在过拟合,尤其AdaBoost,建议未来研究增添更多交叉验证或外部样本验证。
  • 报告中的收益率绝对值不高,模型改进空间仍存在,且合约交割制度、市场流动性及利率环境变迁可能对策略效果产生实质性变动;对此未深入展开讨论。


---

七、结论性综合



本报告基于机器学习辅助的债券组合量化策略,针对目标久期配置探讨蝶式组合在哑铃型子弹型之间的相对表现,构建四类模型对蝶式组合收益率进行预测,并根据收益率信号指导债券组合多头配置,提升投资组合风险调整后回报。

主要发现:
  • 蝶式组合平均月度收益率呈负,累计收益稳步下行,凸显高凸性组合对利率变动更敏感,且策略收益依赖利率曲线斜率趋平及曲率因子的变动。

- NS模型对利率曲线拟合精准但曲率因子噪声较大,导致单靠因子预测蝶式收益风险偏高。
  • XGBoost作为高阶决策树模型,测试集预测解释度最优,随机森林稳定性较高,Lasso在盈利时优势明显,AdaBoost表现略弱,体现多模型融合应用价值。

- 蝶式套利策略年化收益1.0%-1.7%,夏普比率均大于1,全样本测试提升更显著,说明策略具有一定稳定性。
  • 根据信号执行哑铃与子弹型组合轮动,多头配置年化收益较提升至4.2%-4.6%,最大回撤控制良好,有效提高了组合的收益风险比。

- 风险提示明确指出模型基于历史数据,未来存在失效风险,建议谨慎使用并不断更新模型。

报告采用详实图表和数学推导,结合实证数据支持,强化机器学习在债券配置策略中的应用,展现量化模型辅助债券投资的可行性及优势。图表如蝶式组合风险暴露统计、月度收益趋势、模型预测品质对比和多头组合净值走势等均有助于理解策略表现和风险特征,为投资者提供全方位量化分析视角[page::0-20]。

---

(注:全文页码均标注为溯源标记,所有关键结论、数据及图表均对应报告原文各页,即使多页涉及亦采用多个页码标注。)

附:关键图表示例


  • 蝶式组合月度收益(图3)


  • 蝶式组合NS模型拟合(图21)


  • 模型预测效果R2对比(图29)


  • 蝶式策略净值(测试集,图32)


  • 多头配置策略净值(测试集,图36)



---

综上所述,该报告通过严谨理论分析与实证模型搭建,科学归因蝶式组合收益,并结合机器学习模型实现蝶式套利收益率的预测与优化债券组合多头配置,展现了量化策略在债券投资中的实际应用价值及未来潜力。

报告