`

华泰金工 | 回归法估计纯债基金久期

创建于 更新于

摘要

本文基于回归法框架,以纯债基金净值及债券指数净值数据构建OLS、WLS、LAD及其加权版本WLAD模型,自动调整回归指数以缓解久期高估问题。WLAD模型能有效抵抗净值异常跳动,估算误差最小,支持债基久期日频跟踪。基于优化后参数,模型对2024年最新纯债基金久期估算均准确,反映近期债基久期整体上升趋势 [page::0][page::14][page::16][page::17]

速读内容


我国债券型基金规模及纯债基金地位 [page::1]



  • 截至2024Q3,债券型基金规模超10万亿,纯债基金规模达7.72万亿,占债基总规模74.94%。

- 久期是债基配置和风险管理的重要指标,反映债基对利率敏感度。

债基久期的定义与传统估算方法 [page::1][page::2][page::3]

  • 修正久期定义及债基久期可通过重仓券和利率敏感性间接计算。

- 半年度披露久期频率低,难以满足高频监测需求。
  • 相关系数法用指数作为拟合成分存在拟合与久期估算不一致问题。

- 回归法用多债券指数拟合纯债基金净值,可估计债基久期,且能覆盖多久期资产。

各回归模型原理与样本说明 [page::5][page::6][page::7]

  • OLS:最优线性无偏估计,但整体高估久期。

- Lasso/Ridge偏向压缩回归系数,效果不如OLS。
  • WLS通过赋予近端观测更高权重,改善异常变动冲击。

- LAD/WLAD以L1损失函数抑制异常净值跳动影响,测算误差进一步降低。
  • 样本1441只纯债基金,剔除可转债基金及久期波动剧烈基金,保证数据质量。


回归问题及自动调整回归指数 [page::8][page::9][page::10]

  • 固定债券指数集导致对短期债基高估久期问题,自动调整指数集依据久期及持仓动态调整,有效缓解问题。

- OLS自动调整指数后,MAE由0.76降至0.69,中位数误差平均由0.52降至0.49。
  • 典型债基案例显示误差明显改善。


Lasso与Ridge回归表现及原因分析 [page::11][page::12]

  • Lasso和Ridge因惩罚项影响导致回归系数压缩,实际债基债券市值占比被低估,测算表现不佳。

- 细看典型债基回归系数分布,OLS更符合真实持仓权重。

加权最小二乘法(WLS)及最小绝对偏差回归(LAD/WLAD)[page::12][page::13][page::14]

  • WLS通过加大近端数据权重改善了短时持仓突变引发的测算异常,MAE进一步降低至0.69。

- LAD和加权LAD用L1范数损失减少异常净值冲击,MAE降至0.66和0.66。
  • WLAD为目前表现最佳的模型,兼顾稳健与权重调整。


WLAD模型参数优化及异质性设置 [page::15][page::16]

  • 涨跌幅滚动平均3天效果最佳。

- 对中长期债基和短期债基分别采用不同回归窗口长度和最大权重:中长期100天窗口,短期60天窗口,最大权重均为3。
  • 优化后WLAD模型MAE降至0.61,绝对误差中位数均值0.43,测算稳定性和精准度明显提升。


应用案例及最新市场久期测算 [page::16][page::17]



  • 两只典型纯债基金测算久期与真实久期拟合良好,能反映久期变动趋势。


  • 2024年11月最新测算显示,短期纯债基金平均久期约1.07年,中长期纯债基金约2.74年,近期债基久期整体上升。

- 估算久期分布合理,短期纯债集中于0.3-1.2年,中长期纯债集中于1.5-4年区间。

风险提示与免责声明 [page::17][page::18]

  • 模型估算存在误差和市场环境变动导致失效风险。

- 本文不构成投资建议,投资需谨慎。

深度阅读

金融研究报告详细分析 —— 《华泰金工 | 回归法估计纯债基金久期》



---

1. 元数据与报告概览


  • 报告标题:《华泰金工 | 回归法估计纯债基金久期》

- 作者:林晓明、张泽等
  • 发布机构:华泰证券金融工程

- 发布日期:2024年12月13日
  • 主题:纯债基金久期的高频估算方法,重点研究基于回归法的估计技术。

- 核心信息:基于债券指数对债券型基金净值的回归分析,通过多种回归方法评估债基久期的测算准确度。最后推荐基于自动调整回归指数的加权最小绝对偏差回归(WLAD)模型,能对纯债基金进行日频久期跟踪,测算误差较小。

---

2. 逐节深度解读



2.1 报告引言与背景(第0-1页)


  • 债基规模庞大且久期数据披露频率低,截至2024年第三季度,我国债券型基金达到3741只,总规模超10万亿元人民币,纯债型基金占债基规模74.94%(7.72万亿人民币),是重要资产类别。

- 久期对债基收益和风险影响重大,通过中债-新综合财富指数1年期和3-5年期净值曲线的对比显示,久期长的债券净值波动幅度更大,反映收益风险关系。
  • 久期定义与测算介绍

- 详述麦考利久期公式及其衍生的修正久期,后者体现债券价格对利率敏感程度,是本文久期的定义标准。
- 说明债券组合久期是各组成债券久期加权平均,但持仓数据难以全面获取,久期测算多依赖半年度定期披露或持仓报告的近似估算。
  • 债基久期中两种实用测算方式

1. 重仓债券法(基于前五大重仓债券权重和久期估算组合久期)。
2. 利率敏感性分析法(基于基金披露的净值变化与利率变化的敏感度利用公式反推久期)。
  • 当前数据频率滞后,日度高频久期跟踪难实现,现有估算主要三类方法:

- 相关系数法(单一或少数债券指数净值和债基净值相关性较高,按相关度加权计算久期)。
- 回归法(多债券指数作为解释变量,通过系数估计债基成分权重)。
- 机器学习法(以半年度真实久期为标签,多维度特征训练模型进行预测)。

相关系数法缺陷:


  • 单一债券指数相关度虽高,但久期代表范围有限,难以覆盖债基所有久期成分,导致久期估计偏差较大(如案例“兴业嘉荣一年定开”会高估久期)。

- 难以找到相关系数高且覆盖面的指数。

2.2 回归法入手(第3-6页)


  • 回归法原理:构建多元线性回归模型,将债基收益率作为被解释变量,债券指数收益率作为解释变量,回归系数代表成分权重,并设置权重和限制条件:

- 各债券指数权重β_i均在[0,1.4],且总和在[0.8,1.4],对应基金资产杠杆限制。
  • 久期估计:将回归得到的债券指数权重与债券指数久期加权求和,获得估算的债基久期。

- 评分标准:不采用R²,改用平均绝对误差(MAE)及各报告期绝对误差中位数平均,体现估算对异常值的抗干扰能力。
  • 基金样本筛选流程:纯债基金,成立早于2023年1月1日,持续纯债属性,数据完整可靠的1441只基金样本(1214中长期,227短期)。

- 回归参数
- 涨跌幅滚动均值窗口设为5日
- 回归时序窗口为60天
- 默认使用11只国债、政金债及信用债不同久期指数作为解释变量。

2.3 线性回归OLS检测(第7-8页)


  • OLS回归整体呈现久期高估趋势,MAE约0.76年,误差分布右偏明显。

- 误差时序变化相对平稳,但个别基金误差大。
  • 示例“华泰紫金丰益中短债007819.OF”在2020年12月期测试中,OLS误判久期达25年,因为OLS回归系数全部赋予国债10年以上指数(该基金主要持短期信用债),体现了固定回归指数缺乏动态适应持仓的缺点。


2.4 自动调整回归指数算法(第8-10页)


  • 根据基金季报久期和债券持仓类型动态选取适合的回归指数类别,用于回归中的解释变量组合。

- 债基类型判定:
- 短期纯债基金或平均久期低于3年判定为短期债基,选择相应短期指数。
- 否则判断为中长期债基,选择对应的中长期指数。
  • 根据持仓券种占比调整指数集(高信用债兼顾或剔除利率债指数等)。

- 自动调整回归指数后,OLS测算MAE降至0.69,误差分布更集中,右偏减弱,且测算短债基金误差明显下降。
  • 同一基金007819.OF测算误差明显改善,回归系数分配更合理。(图13)


2.5 Lasso与Ridge回归测试(第10-12页)


  • 为缓解债券指数间多重共线性,尝试Lasso和Ridge回归。

- 回归系数加正则化项限制,但结果反而比OLS稍差,MAE升至0.76(Lasso λ=0.01)及更高(Ridge λ=0.01 MAE=1.88)。
  • 原因:正则化导致回归系数被压缩,甚至回归系数总和降至0.8约束下限,而实际债基杠杆超过1,导致权重不足测算误差增大。

- 以“华夏鼎丰013780.OF”为例,Lasso和Ridge误差明显高于OLS。
  • 结论不推荐使用Lasso和Ridge估算纯债基金久期。


2.6 加权最小二乘法(WLS)模型优化(第12-14页)


  • 针对债基短期持仓突变导致OLS估计误差较大(例如“景顺长城景泰鑫利纯债A(006764.OF)”2021年持仓剧变,OLS误差激增至6.66)。

- WLS通过赋予最新的观测数据更高权重缓解历史持仓信息迟缓,使回归更贴近最新持仓结构。
  • 案例显示WLS将上述误差降低到3.00,MAE整体也由0.91降至0.65。

- 全样本WLS对比OLS误差分布显示,整体MAE小幅下降为0.689,绝对误差中位数均值0.48,测算效果有所提升。

2.7 最小绝对偏差回归(LAD)与加权LAD(WLAD)(第14-16页)



-考虑异常净值跳动(大额申赎、信用事件)导致的回归异常,WLAD选择L1范数损失函数减少大残差影响。
  • LAD和WLAD进一步降低MAE至0.663和0.656,绝对误差中位数均值分别降至0.47和0.45,精度最优。

- WLAD在后续章节作为基准模型进一步调优。

---

3. 图表深度解读


  • 图表1、2(基金规模及占比)展示债券型基金及纯债基金2010年至2024Q3的资产净值快速增长趋势,且占整体公募基金比例不断提升,强调债基的重要性。

  • 图表3(不同久期指数净值曲线对比)凸显短期债券(1年以下)与中长期债券(3-5年)净值反映的风险差异,证明久期对债基收益波动和风险影响关键。
  • 图表4(某债基净值与信用债指数拟合)展示此相关系数法示例净值拟合良好,但后续对比表5的久期显示明显高估,突出单一指数限制。
  • 图表5(兴业嘉荣伙伴债基与中证中期信用债指数久期对比)久期差值达到1年多,显著说明单一指数久期覆盖不全。
  • 图表7、8(OLS误差分布及时序):误差表现明显集中在正值区间(高估),箱型图揭示部分久期误差个案极值偏大。
  • 图表9(华泰紫金丰益基金测算误差):重大偏差示例,OLS将久期高估至25年不符基金实际持仓。
  • 图表11、12(OLS自动调节指数后误差改善)误差分布偏态减弱,误差更集中,中位数明显下降表明模型更稳健。
  • 图表14、15(Lasso与Ridge回归误差)呈现惩罚项加大误差上升趋势,反映过度限制系数不利。
  • 图表16(Lasso与Ridge与OLS对比表)清晰量化了误差升高的效果差距。
  • 图表17、18(具体基金回归误差与系数分配)验证Lasso/Ridge系数受惩罚大幅收缩、加权和下限影响,导致估算劣化。
  • 图表19、20(基金持仓突变及WLS误差修正),说明WLS利用权重机制缓和历史信息滞后,减少估算异常。
  • 图表21、22(WLS全样本误差表现)MAE微幅改善但效果有限。
  • 图表23、24(LAD与WLAD误差)通过使用L1范数,更有力去除异常点影响,显著降低误差。
  • 图表25、26(各种模型误差整体对比),WLAD模型表现最佳。
  • 图表27(涨跌幅滚动区间参数变化对误差影响),3日滚动均值平滑效果最佳,长短久期基金均获益。
  • 图表28(回归窗口长度和权重最大值调参),长久期基金使用100天回归窗口,短久期基金用60天窗口配权重3为最佳参数组合。
  • 图表29、30(优化参数后的WLAD误差分布及时序),MAE进一步降低至0.61,误差稳定且异常减小。
  • 图表31、32(单只基金实测vs估测久期示例),估算趋势贴合真实信号,体现模型较好捕捉久期变化。
  • 图表33、34(全市场短期与中长期纯债基金历年平均久期对比),测算值与真实值紧密匹配,预测2024年11月久期较2024中期明显上升。
  • 图表35、36(久期分布)短期纯债主要集中0.3~1.2年区间,中长期纯债分布广泛,集中2~4年。


---

4. 估值分析



本报告核心非传统企业估值,主要是通过回归技术多指数加权估算债基久期的统计模型,侧重构建稳健有效的成分权重估计方法,衡量债基利率风险(通过久期间接体现)的时变情况。模型基础涵盖OLS、正则化回归(Lasso、Ridge)、加权/绝对误差最小化(WLS、LAD、WLAD)等方法,结合动态回归指数筛选实现更适合债基动态持仓的量化反映。
  • 输入主要包括债基净值收益率序列与多档债券指数收益率序列。

- 约束条件体现基金监管限额(资产杠杆上限等)。
  • 估算久期为回归系数加权的债券指数久期之和。

- 模型的调优参数如滚动窗口、权重递增策略等均针对实际持仓波动进行设置,力图兼顾历史和最新数据特征。
  • 估值/测算准确度以平均绝对误差(MAE)及中位数误差为核心度量标准,优于传统拟合优度指标。

- 模型操作着重保证稳健性与可解释性,降低异常净值跳动对结果扰动,WLAD模型体现最优。

---

5. 风险因素评估


  • 模型测算与真实情况的不一致风险:估算久期基于回归模型和历史净值数据,若债基未来持仓策略或宏观利率环境发生急剧变化,模型拟合效果可能大幅下降。

- 数据滞后和缺失风险:模型依赖半年度真实久期作为标签,样本相对有限,且净值受基金申赎等行为影响可能带噪声。
  • 市场环境变化风险:利率走势、信用风险、流动性风险等市场环境复杂多变,模型难以完全捕捉,可能导致测算误差超预期。

- 模型固有假设风险:回归假设、线性组合形式、权重限制等均简单预设,实际复杂程度可能超出模型容量。
  • 异常值处理风险:尽管WLAD优于OLS减少异常点影响,但极端市场事件仍可能导致测算偏差。

- 估算结果不作为投资建议风险:报告明确声明不构成任何具体基金买卖推荐,投资需谨慎。

---

6. 审慎视角与细微差别


  • 回归系数上下限设置合理但可能限制模型表现:实际基金杠杆虽有限制,但部分基金持仓多变,导致部分回归系数边界约束紧张,可能无法充分反映实际久期成分。

- Lasso和Ridge的负面效果提醒应慎重使用正则化:在该场景下,压缩系数降低了权重总和,违背了实际资产杠杆利用实际,表明机器学习/正则回归模型需谨慎设计。
  • 自动调整回归指数选择规则简单明了,实用性强但仍有改进空间:目前使用简单规则切分短中长久期及持仓比例,未来可考虑更复杂分类或动态学习选择。

- 异常值处理依赖L1范数,仍可能不完美隔离非持仓异常:净值异常受多因素影响,不全部由固有债券成分波动引起。
  • 样本筛选剔除极端波动基金,保证模型有效性但降低普适率:切分可包含高波动基金的深度研究或其它方法辅助。

- 数据截面分布明晰,机构数据来源可靠,但无法完全控制样本质量与数据缺漏带来的误差
  • 评价指标侧重MAE,较稳健但对极端误差权重较轻,可能掩盖某些极端估算遗漏


---

7. 结论性综合



报告深入系统地剖析了当前纯债基金久期的估算技术,重点聚焦于基于多债券指数回归的测算框架。主要结论如下:
  1. 纯债基金久期为债基利率风险基本反映指标,市场规模庞大,精确高频测算需求强烈。
  2. 现有久期数据半年度披露频率低,难以满足高频监测需求。
  3. 相关系数法因单指数成分限制,往往高估或偏差较大,不适应复杂持仓结构。
  4. 回归法通过多指数联合拟合净值变化,能覆盖不同久期和债券类型,更有效估算久期成分权重。
  5. 固定回归指数方案存在测算久期偏高的系统误差,采用债基持仓与久期信息动态筛选回归指数后,误差显著减小。
  6. 传统OLS估计整体表现良好,但受异常净值跳动影响存在测算偏差。
  7. Lasso和Ridge回归因系数压缩导致估算权重不足,误差大幅增大,表现不佳。
  8. 加权最小二乘法(WLS)通过给近期数据更高权重改善了对短期持仓变动的适应能力,使极端估算误差显著降低。
  9. 最小绝对偏差法(LAD)及其加权版本(WLAD)进一步抑制异动异常净值干扰,误差平均及中位数指标均达到最佳,表现最优。
  10. 模型参数优化结果显示,短债基适合较短回归窗口(60天)、长债基适合较长窗口(100天),涨跌幅滚动平均3日效果最好,最大权重取3保持回归平滑合理。
  11. 采用最终参数的WLAD模型,平均绝对误差约0.61年,绝对误差中位数均值约0.43年。在样本测试及个例基金中均表现出较强的趋势捕捉能力与误差控制。
  12. 对全市场纯债基金2024年11月底最新估算显示,短债基平均久期约1.07年,中长债基约2.74年,均较此前有所攀升,反映出当前利率风险偏好变化及基金策略调整情况。
  13. 估算分布体现市场多样性:短债基主要聚集在0.3~1.2年久期,中长债基聚焦1.5~4年区间,显示久期分层明显。
  14. 报告明确模型局限与风险,强调估算结果不作为直接投资建议,需警惕未来市场环境变化与数据约束带来的不确定性。


---

总体评价



本报告结构清晰、逻辑严密,从理论迈向实务,结合多模型对比,深入剖析估算方法优劣,严谨科学地提出和验证了基于回归的债基久期测算框架。全文图表丰富,数据详实,且对金融工程和量化投资领域的专业术语如麦考利久期、修正久期、OLS/Lasso/Ridge/WLS/LAD/WLAD等均作清晰解释,兼顾了复杂概念的易理解性与深度。重点关注实用性,是债券投资风险管理与债基风控领域的重要参考材料。

---

重要引用与溯源


  • 债基规模与结构数据及久期基础介绍见[p::1]

- 麦考利久期与修正久期推导见[p::2]
  • 利率风险敏感性测算方法说明及示例见[p::3]

- 回归法估算模型及系数约束条件见[p::4]
  • 相关系数法局限性与回归法基本框架见[p::4][p::5]

- OLS回归误差表现与自动调整回归指数优化见[p::7][p::8][p::9][p::10]
  • Lasso/Ridge回归的实际表现及系数压缩问题见[p::10][p::11][p::12]

- WLS加权回归缓解短期持仓变动影响见[p::12][p::13][p::14]
  • LAD和WLAD提升稳健性及误差控制见[p::14][p::15]

- WLAD参数优化与最终模型推荐见[p::15][p::16]
  • 单只基金估算效果及全市场久期测算趋势见[p::16][p::17]

- 模型风险提示与声明见[p::17][p::18]

(注:因整体文档跨页引用,页码仅代表参考位置)

---

以上为该《华泰金工 | 回归法估计纯债基金久期》研究报告的全面详尽分析,涵盖报告内容、数据、方法、模型比较、风险提示及结论,体现了报告对债券基金久期测算技术的深刻洞见和实用价值。

报告