基本面量化之二:国债的 Beta
创建于 更新于
摘要
本报告基于58个国债基本面因子,运用Complete Subset Regressions(CSR)方法筛选40个关键因子,构建国债收益率预测模型。通过相关性和主成分分析确立因子预测的可行性,并利用样本内外回测验证模型有效性,子策略组合在市场拐点表现稳定,整体预测胜率约65%,模型具备一定适应性和预测性[page::0][page::7][page::9][page::12][page::19][page::20]。
速读内容
研究方法与数据描述 [page::3][page::4]
- 采用Complete Subset Regressions(CSR)方法,克服回归中多重共线性和过拟合问题。
- 数据涵盖经济增长、通货膨胀、流动性及银行负债结构四大框架,共计40个因子,均为月频数据,对齐于月末。
主要因子识别与相关性分析 [page::5][page::6][page::7][page::8]

- 因子与国债收益率存在显著相关性,部分因子相关性高,显示预测潜力。

- 相关系数热力图揭示因子间显著的正负相关关系,提示建模需筛选高效变量。
主成分分析结果 [page::9][page::10]

- 5个主成分累计解释自变量85.1%方差,但无突出单因子,提示难以进一步降维实现简化因子构建。
CSR因子筛选与初选结果 [page::12][page::13][page::14]

- CSR筛选出影响国债收益率变动的重要因子包括v2、v7、v14、v18、v20、v24、v25、v27、v29、v31、v32、v33、v38和v40等,覆盖投资、通膨、流动性等领域。
- 初选重要指标共17个,包括制造业固定资产投资完成额同比、房屋新开工面积累计同比、一级散装菜籽油价格等。
样本内测试与模型筛选 [page::15][page::16][page::17]



- 样本内30个月测试中,调整R方最高0.34,利用调整R方、AIC和P值筛选得出19个回归方程。
- 子策略19个组合累计净收益显著,表现较稳定。
样本外验证与策略表现 [page::18][page::19][page::20]



| 策略 | 样本内期间 | 样本外期间 | 胜率 | 年化收益 (BP) | 累计收益 (BP) |
|---------|--------------------------|-----------------------------|------|---------------|---------------|
| 子策略1 | 2012年5月至2014年10月 | 2014年11月至2017年12月 | 65% | 30 | 171 |
| 子策略2 | 2012年5月至2014年10月 | 2014年11月至2017年12月 | 66% | 36 | 206 |
- 样本外38个月测试显示模型适应性良好,预测胜率稳定在65%左右。
- 2017年上半年出现回撤,推测受金融监管政策影响,模型难以捕捉此类非基本面事件。
策略跟踪方案与展望 [page::20]
- 两种跟踪方式:自动跟踪优选子策略和主观赋权多子策略方程组。
- 未来将完善动态预测模型,探索政策监管影响,将基本面量化Beta策略应用扩展至商品期货和外汇市场。
深度阅读
《基本面量化之二:国债的 Beta》详细分析报告
---
1. 元数据与概览
- 报告标题:《基本面量化之二:国债的 Beta》
- 作者:章顺(高级分析师,基本面量化)
- 机构:上海东证期货有限公司,东证衍生品研究院
- 发布日期:2018年1月3日
- 研究主题:本报告围绕国债基本面因子进行因子定价与预测,重点研究通过58个筛选出的国债重要因子构建国债Beta模型,实现国债收益率的预测和量化交易策略构建。研究方法核心为Complete Subset Regressions(CSR)以克服多因子模型过拟合及共线性问题,兼具样本内和样本外的实证验证。
核心论点及目标
报告旨在通过筛选符合建模需求的核心基本面因子(最终40个),构建以国债Beta为核心的多因子预测模型。利用宏观经济增长、通胀、流动性、银行负债结构等信息,搭配CSR回归方法,形成组合子策略进行国债收益率波动的预测和跟踪,达到约65%的预测胜率。
报告展示了模型在样本内30个月及样本外38个月的数据验证效果,并且通过子策略组合策略有效控制了市场拐点时的净值波动。后续展望为尝试引入政策监管变量动态模型,并推广至商品期货和外汇领域,延续“基本面为主,量化为辅”的研究思路。[page::0,3,19,20]
---
2. 逐节深度解读
2.1 导读及方法论介绍
报告开篇回顾了《基本面量化之一:国债的重要因子》筛选的58个指标,强调资产收益率因子定价的重要性和资本资产定价模型(CAPM)、Fama-French模型等经典理论的启发。债券市场因其封闭性和外资进入限制,因子定价研究相对较少,作者指出以宏观基本面因子预测国债Beta具有理论和实务上的创新价值。提出采用Elliott等(2013)提出的CSR方法(全子集回归法)以解决传统多因子回归的共线性和过拟合问题,从而提高因子筛选和预测的稳健性。[page::3,4]
2.2 研究方法与数据选择
- CSR方法核心思想是将所有潜在自变量组合成全集合,选择固定数量自变量构建所有可能的回归子集,最终通过平均所有子模型预测值,增强预测稳定性与泛化能力。数学表达式具体说明了预测值的加权平均流程。[page::4]
- 数据处理
选用10年期国债收益率(月频化处理),以及对58个因子中根据时间区间和公布延迟筛选,符合预测频次(统一调整为月度并统一日期)和样本长度(至少6年)要求的40个因子纳入模型。具体指标涵盖经济增长、通胀、流动性、银行负债框架等,详见图表1-4。[page::4-7]
2.3 因子分析(相关性与主成分分析)
- 相关性分析
图表5与6展示自变量与国债收益率的相关性及因变量之间的相关系数矩阵。结果指出:
- 国债与其他债券利差及部分经济指标负相关明显;
- 欧元兑美元汇率与经济类指标正相关,且与债券利差负相关;
- 多数经济指标内部呈正相关,提示存在共线性问题。
这验证了因子具有一定的预测意义,但也提醒需要CSR等方法筛选关键因子以避免多重共线性带来的估计扭曲。[page::7-8]
- 主成分分析
图表7-9显示,通过主成分分析提取的前5个主成分能解释85%以上的信息,但各自变量在主成分中的贡献度均匀,无突出主导变量。碎石图(图表8)也显示5个主成分后贡献率趋平,表明难以通过单一主成分找出关键因素,需结合其他筛选手段决策因子。[page::9-10]
2.4 实证研究:CSR因子筛选与模型测试
- CSR初选因子筛选
通过CSR回归,设定子模型因子数nbes=6,调整后的R^2最大约0.3。初选因子集中于v2(制造业投资)、v7(房屋新开工面积)、v14(散装菜籽油均价)、v18(社会融资规模同比)、v20(金融机构各项存款同比)、v24(美元指数)、v25(欧元兑美元)、v27(外汇储备)、v29(公共财政支出)、v31/v32(存款类机构准备金率)、v33(商业银行国债托管量)等和v38、v40等指标,这些因子涵盖经济增长、通胀、流动性和银行负债结构等方面,符合经济逻辑。[page::12-14]
- 样本内测试
采用30个月样本内数据,纳入高频通胀类指标(如豆腐等农产品价格平均值)提升预测灵敏度。图表14-17展示particular 72个回归方程的调整R方和AIC值排序,筛选19个优质回归方程形成组合策略,路径预测期内累积净收益显著,且各子策略收益和重合度均不错,显示策略表现稳健。[page::15-17]
- 样本外测试及子策略表现
在38个月的样本外测试中,进一步筛选出2个表现优异的子策略,图表18-20分别展示了它们在68个月合并视角、样本内30个月及样本外38个月的累计净损益曲线,均展现出正向收益趋势,预测胜率均超过65%,年化收益率30-36BP,累计收益达到171BP与206BP。
但两个子策略在2017年上半年出现明显回撤,报告分析该年回撤主要由未纳入模型的金融监管政策变动导致,表示金融监管信息难以量化且具有显著影响,后续拟加强对政策变量的研究。[page::18-19]
2.5 策略跟踪方案与结论
- 策略跟踪方案
报告提出两种策略跟踪方式:
1. 使用2个优选子策略进行动态预测与更新。
2. 使用19个回归方程构成方程组,既可单独监控,又可主观赋权调整,确保对因子的灵活应对和风险分散。
- 结论
总结了从58个初始因子到40个建模因子,再经CSR筛选到最终两个高质量子策略的过程。验证模型能较好刻画国债Beta,具备约65%的预测胜率及稳定的累积收益,体现了基本面因子的预测价值和CSR技术的优越性。同时指出监管变量缺失导致短期模型失效风险,建议未来将探索动态模型和政策因子的深入整合。最后提出计划将基本面量化研究推广至商品期货及外汇市场。[page::19-20]
---
3. 图表深度解读
图表1-4 重要指标汇总表
详细列出经济增长、通胀、流动性和商业银行投资行为等四大框架内的关键指标及其数据来源、公布频率和时间区间,保障数据质量与时间覆盖的合法性。
如:经济增长部分自1992年起覆盖固定资产投资、工业增加值及PMI各类数据;通胀部分涵盖CPI核心指数及多个日频农工商品价格;流动性指标含各类利率、融资余额及汇率指标;银行投资行为指标涵盖国债与各类债券利差及贷款存款比率。明确了数据频率从日频转换到月频,便于统一模型计算。[page::5-7]
图表5 相关性分析柱状图
展示40个自变量与国债收益率之间的Pearson相关系数。显著正相关因子如美元指数v24、欧元兑美元v25、外汇储备v27等,负相关的多为与国债收益率利差相关因子(v35、v37、v38等)。此图提供基线判断因子对目标变量的直接线性关系,强调预测可行性。[page::7]
图表6 变量相关系数矩阵
以色彩深浅和点大小标识相关程度,区分正负相关,验证因子间强共线性是否存在。如经济类指标内部高度正相关,而债券利差部分因子与经济指标负相关,为后续模型筛选提供依据,必须考虑共线性影响并进行因子筛选或降维。[page::8]
图表7-9 主成分分析
表格显示前5主成分贡献85%信息量,但各因子贡献均匀,不具备明显降维优势;碎石图辅助判断信息量递减趋势,支持综合利用CSR而非单一主成分进行建模。[page::9-10]
图表10-13 CSR筛选结果与重要因子列表
热力图形式展现多回归模型中因子出现频次与调整R方,突出v2、v7、v14、v18、v20、v24、v25、v27等指标为高价值因子。图表13汇总最终纳入模型的17个重要指标,说明指标覆盖经济、通胀、流动性和银行负债多个维度,是模型多信息融合的体现。[page::12-14]
图表14-17 样本内测试结果及策略组合
显示72个回归模型调整R方,最大约0.34,部分模型拟合较差;AIC曲线辅助模型优劣排序并筛选19个回归方程作为子策略组合。图表17展示子策略组合逐步累计净收益稳健增长突破100BP,验证了组合策略的实用性和风险分散效果。[page::15-17]
图表18-20 样本内外子策略净收益曲线
两优选子策略被分别绘制,显示出样本内和样本外均表现出正收益趋势,累计收益稳步增长至180-230BP区间,验证模型的样本外泛化能力。2017年中出现回调,验证了市场监管等外部因素对模型表现的影响。[page::18]
图表21 子策略样本内外绩效指标表
关键量化指标如胜率约65%,年化收益30-36BP,累计收益171-206BP表明模型具备稳定盈利能力。结合其他图表,此表盘实证模型的核心成果,展现基本面Beta策略的实际投资应用价值。[page::19]
---
4. 估值分析
报告没有涉及具体的资产估值模型和价格目标,而是聚焦于因子定价和预测模型的构建和实证,故无具体估值方法(如DCF、PE倍数等)的讨论。模型更多用于收益率波动的预测和风险管理,是资产定价领域的因子分析应用。[page::无相关]
---
5. 风险因素评估
报告中明确了几个重要风险因素:
- 模型失效风险:如2017年上半年出现的回撤,模型未能纳入金融监管信息,导致误判利率变动方向。监管信息难以量化且存在显著有效性缺失,是现阶段模型的显著局限。
- 因子数据质量及时间延迟:数据公布时间窗口较宽、频率不一致,统一月度处理虽便利但可能造成信息滞后或遮蔽高频信号。
- 共线性及过拟合风险:40多个因子相关性较强,传统多元回归存在过拟合风险,CSR方法虽减缓该问题,但仍需动态跟踪模型的稳定性。
- 宏观经济环境变化:宏观基本面强烈影响但不可控因素多,政策和市场环境非静态,预测能力随时间可能衰减。
报告建议引入更加动态的预测模型和政策变量,以减缓上述风险影响,提升模型的稳健性。[page::0,19,20]
---
6. 批判性视角与细微差别
- 优势:本报告系统地集成丰富国债基本面因子,利用先进的CSR回归方法,结合严格的样本内外测试策略,展现较强的预测能力和策略实用价值,并有清晰的风险识别和模型限制说明,整体研究框架科学严谨。
- 局限性:
- 报告虽提出金融监管等政策因子影响重大,但未实际计入,这在2017年回撤中表现明显,表明关键外生变量的缺失限制了模型的完整性和适应性。
- CSR方法选优虽降低了过拟合风险,但调整R方约0.3,预测能力仍有提升空间,且报告未详细披露具体系数敏感性或模型稳定性分析,存在部分信息不透明的隐忧。
- 主成分分析未能明确帮助减少因素维度,显示因子间信息高度散布,后续模型控制复杂度和动态因子适应性亟需进一步挖掘。
- 细节补充:报告标明数据频率从日频向月频转化,可能丢失短期波动信息;模型交易模拟未设止盈止损,偏重长期趋势预测,适合宏观配置而非高频交易。
---
7. 结论性综合
本报告基于精选的58个国债基本面因子经过严格筛选与数据处理,最终利用40个核心因子通过CSR方法全子集回归建模,成功构建了国债Beta预测模型。模型在30个月样本内和38个月样本外均展现了约65%的胜率和30BP以上年化收益,结合19个子策略与2个优选子策略的组合应用实现风险分散,表现稳健且具有实际投资参考价值。
模型涵盖经济增长、通货膨胀、流动性、银行负债等多维基本面信息,呈现国债收益率预测的可行路径。图表中展示了详细因子相关性、主成分分布和CSR因子筛选过程,反映模型从繁复变量走向精炼因子组合,凸显数据驱动和量化技术的融合效果。子策略累计净收益曲线表明模型能持续累积正收益但对重大政策冲击敏感,凸显了政策变量在国债因子模型中的重要性。
报告总结强调未来模型将兼顾动态更新和政策监管变量加入,同时推广至更广泛资产类别,保持“基本面为主,量化为辅”的创新研究理念,展现出国债因子定价研究良好发展前景和广泛应用空间。[page::0-20]
---
(注:所有引用均标明对应页码,图表采用markdown格式时均以示例格式呈现)