`

Barra 风险模型 (CNE6)之纯因子构建与因子合成—多因子模型研究系列之九

创建于 更新于

摘要

本报告基于Barra CNE6风险模型,对全A股构建并回测一级及二级纯因子组合,采用月度调仓,回测区间为2009年1月至2019年4月。结果显示,流动性和动量因子表现稳定,规模因子和波动率因子收益波动较大,质量因子近期回撤明显。报告针对规模和质量因子二级因子收益分化,调整MIDCAP和Earnings Quality权重,优化纯因子组合,提升模型拟合度及夏普比率。此外,报告详细解读了每个一级及二级因子的构成、统计指标以及纯因子回测曲线,为因子投资策略构建提供理论和实证支持 [page::0][page::3][page::4][page::5][page::7][page::8][page::12][page::13][page::16]

速读内容


研究背景及纯因子模型构建方法 [page::0][page::3]

  • 分层回测无法剔除其他因子影响,纯因子模型通过约束回归确保单因子暴露为1,其余为0,更客观反映因子收益。

- 纯因子权重矩阵利用带约束的加权最小二乘法求解,考虑行业市值权重和流动市值加权调整异方差。
  • 以沪深A股为标的,月度调仓,回测期2009-01至2019-04。


一级因子纯因子统计与回测表现 [page::4][page::5]


| 因子 | 累计收益 | 年化收益 | 波动率 | 夏普比率 | 胜率 |
|--------|-----------|-----------|---------|------------|--------|
| liq | -62.77% | -9.12% | 3.84% | -2.3768 | 22.58% |
| mom | -52.26% | -6.91% | 5.30% | -1.3017 | 41.94% |
| quality| 32.46% | 2.76% | 4.06% | 0.6788 | 59.68% |
| growth | -3.91% | -0.39% | 1.08% | -0.3562 | 54.03% |
| size | -9.38% | -0.95% | 4.13% | -0.2298 | 44.35% |
| vol | 29.32% | 2.52% | 5.46% | 0.4616 | 51.61% |
| value | 24.98% | 2.18% | 4.79% | 0.4554 | 58.87% |
| DTOP | 8.21% | 0.77% | 1.01% | 0.7624 | 58.87% |
  • 质量因子、波动率和估值因子具有较好的收益和夏普表现。

- 流动性和动量因子近期表现较弱,波动较大。

规模因子详细分析与权重调整 [page::7]


| 因子 | 累计收益 | 年化收益 | 波动率 | 最大回撤 | 夏普比率 | 胜率 |
|--------|-----------|-----------|---------|----------|-----------|--------|
| LNCAP | -18.16% | -1.92% | 2.36% | 19.64% | -0.8148 | 37.90% |
| MIDCAP | 8.46% | 0.79% | 2.79% | 7.31% | 0.2825 | 53.23% |
| size | -9.38% | -0.95% | 4.13% | 24.66% | -0.2298 | 44.35% |
  • LNCAP与MIDCAP收益方向出现分化,特别是2015年后。

- 调整MIDCAP权重为负向后,规模因子表现有所提升。

波动率因子构成与表现 [page::8]


| 因子 | 累计收益 | 年化收益 | 波动率 | 最大回撤 | 夏普比率 | 胜率 |
|--------|-----------|-----------|---------|----------|----------|--------|
| BETA | 16.39% | 1.48% | 2.39% | 3.28% | 0.6196 | 59.68% |
| resvol | 16.27% | 1.47% | 4.46% | 9.69% | 0.3295 | 49.19% |
| vol | 29.32% | 2.52% | 5.46% | 7.33% | 0.4616 | 51.61% |
  • Beta与残余波动率表现类似,但Residual Volatility在2016-2018年间出现收益反转。


质量因子细分及异质性分析 [page::11][page::12]


| 因子 | 累计收益 | 年化收益 | 波动率 | 最大回撤 | 夏普比率 | 胜率 |
|------------|-----------|-----------|---------|----------|----------|--------|
| lev | -1.08% | -0.11% | 1.54% | 7.51% | -0.0684 | 47.58% |
| earvar | 5.06% | 0.48% | 1.67% | 3.75% | 0.2873 | 52.42% |
| eq | -10.62% | -1.08% | 1.26% | 12.38% | -0.8563 | 42.74% |
| profit | 37.58% | 3.14% | 2.75% | 3.22% | 1.1385 | 64.52% |
| iq | 18.08% | 1.62% | 2.22% | 3.11% | 0.7302 | 62.10% |
| quality | 32.46% | 2.76% | 4.06% | 8.69% | 0.6788 | 59.68% |
  • 盈利质量(Earnings Quality)与盈利能力(Profitability)因子收益方向相反,合成时部分抵消。

- 调整Earnings Quality权重为负向后,质量因子纯因子表现改善。

动量因子多维构成及表现差异 [page::13]


| 因子 | 累计收益 | 年化收益 | 波动率 | 最大回撤 | 夏普比率 | 胜率 |
|--------|----------|----------|--------|----------|-----------|--------|
| STREV | -48.24% | -6.17% | 3.17% | 48.24% | -1.9495 | 28.23% |
| SEASON | -2.93% | -0.29% | 0.90% | 3.80% | -0.3198 | 41.94% |
| INDMOM | 0.91% | 0.09% | 0.61% | 1.52% | 0.1435 | 56.45% |
| mom1 | -9.48% | -0.96% | 3.16% | 16.73% | -0.3037 | 48.39% |
| mom | -52.26% | -6.91% | 5.30% | 52.26% | -1.3017 | 41.94% |
  • 短期反转因子收益贡献最大且明显负向。

- 季节性和行业动量因子收益较为稳定且低相关,但整体动量因子表现不佳。

分红与成长因子表现 [page::14][page::15]

  • 成长因子历史回测收益整体不显著,表现偏弱。

- 分红因子新增且近年收益明显,是较有潜力的新因子。

调整后纯因子综合表现提升 [page::15][page::16]


| 因子 | 累计收益 | 年化收益 | 波动率 | 最大回撤 | 夏普比率 | 胜率 |
|---------|-----------|-----------|---------|----------|----------|--------|
| liq | -62.77% | -9.12% | 3.84% | 62.77% | -2.3768 | 22.58% |
| mom | -52.26% | -6.91% | 5.30% | 52.26% | -1.3017 | 41.94% |
| quality | 32.46% | 2.76% | 4.06% | 8.69% | 0.6788 | 59.68% |
| growth | -3.91% | -0.39% | 1.08% | 5.47% | -0.3562 | 54.03% |
| size | -9.38% | -0.95% | 4.13% | 24.66% | -0.2298 | 44.35% |
| vol | 29.32% | 2.52% | 5.46% | 7.33% | 0.4616 | 51.61% |
| value | 24.98% | 2.18% | 4.79% | 7.97% | 0.4554 | 58.87% |
| DTOP | 8.21% | 0.77% | 1.01% | 2.46% | 0.7624 | 58.87% |
  • 通过调整MIDCAP和Earnings Quality的权重,模型的拟合度Adjusted R²由34%提升至36%,规模因子和质量因子夏普比率显著提高。

- 该调整提升了纯因子组合稳定性和解释能力。

结论与未来方向 [page::16]

  • 纯因子模型比传统分层回测更客观准确地衡量单因子收益能力。

- 不同因子间存在异质性,适当调整合成权重可提升整体模型表现。
  • 未来拟将纯因子模型应用于指数增强及机器学习选股模型,挖掘更多有效因子。

- 风险提示:模型基于历史数据,市场环境变化可能导致模型失效。

深度阅读

Barra风险模型(CNE6)之纯因子构建与因子合成—多因子模型研究系列之九【详尽分析报告】



---

1. 元数据与概览


  • 报告标题:Barra风险模型(CNE6)之纯因子构建与因子合成—多因子模型研究系列之九

- 分析师:宋旸
  • 发布机构:渤海证券研究所

- 发布日期:2019年6月20日
  • 主题:基于Barra CNE6风险模型,构建纯因子组合并进行回测分析,进而生成风险模型基础、优化因子权重,为多因子选股模型后续应用提供支持。


核心观点总结



本报告核心讨论了传统单因子分层回测存在的缺陷,即无法控制与其他因子暴露的中性,导致因子表现受混淆影响,提出构建纯因子模型来解决此问题。纯因子模型中某一因子的暴露为1,其他因子暴露为0,能更客观评价该因子的独立收益能力。通过对全A股月度调仓,2009年1月至2019年4月的回测,发现:
  • 流动性因子动量因子表现较为稳定。

- 规模因子波动率因子的收益波动较大。
  • 质量因子近期出现一定的收益回撤。


基于二级因子回测结果,标的合成权重进行了调整,使规模因子中的MIDCAP因子和质量因子中的Earnings Quality因子权重由正转负,模型的拟合优度Adjusted $R^2$由34%提升至36%;对应的夏普率也获得显著提升。未来,报告计划将该风险因子模型应用于指数增强、机器学习等多种选股模型。本报告强调,模型随市场环境变化存在失效风险[page::0,16]。

---

2. 逐节深度解读



2.1 概述与研究背景(第3页)



报告指出此前(系列八)使用单因子回归和分层回测进行因子收益检验,分层回测简单直观,但无法保证测试因子暴露其他因子中性,因而导致收益被其他因子影响。为此提出纯因子模型,即确保目标因子暴露为1,其他因子暴露为0,克服了传统方法的缺陷,以更客观地反映因子收益能力和投资价值[page::3]。

2.2 纯因子模型求解方法(第3-4页)



方法论


  • 纯因子模型通过带约束的回归求解,设计加权矩阵 $\mathbf{V}$,利用标的流动市值的平方根加权解决异方差问题;

- 因为一国 + 多行业因子导致行业因子完美共线,加入行业市值权重限制以保证回归解的唯一性;
  • 采用最小二乘法带约束形式求得纯因子权重矩阵 $\Omega$,每行对应一个纯因子组合权重;

- 由于权重矩阵的设计,纯因子组合能排除行业风险和国家风险,且不受其他因子暴露影响。

该数学模型的精细设计为后续纯因子收益的有效提取提供了坚实的理论基础[page::3-4]。

2.3 回测方法与整体结果(第4-5页)


  • 样本选取A股市场,频率为月度调仓,回测周期为2009-01至2019-04;

- 统计指标包括累计收益、年化收益、年化波动率、夏普比率、胜率等。
  • 关键发现:流动性(liq)与动量(mom)表现稳定(见下表及图1),而规模(size)因子、波动率(vol)因子波动较大,质量(quality)因子近年回撤明显。

示例表1“一级因子纯因子统计结果”:

> - liq累计收益-62.77%,年化收益-9.12%,波动率3.84%,夏普率-2.3768,胜率22.58%;说明流动性因子收益负且波动稳定,但整体表现差。
- quality累计收益32.46%,年化2.76%,夏普比率0.6788,胜率59.68%;表现较好且收益稳定。

> - vol累计收益29.32%,夏普0.4616,波动性较大。
- mom累计收益为负且夏普也差。


图1显示累计收益曲线清晰展现上述趋势,质量因子长期稳步上涨,而流动性和动量因子整体下跌,规模因子(size)和波动率因子表现波动明显[page::4-5]。

2.4 因子相关性分析(二级与一级因子相关性矩阵,第6页)


  • 图2为二级因子相关性矩阵显示大部分相关系数较低,唯有市值与中等市值(MIDCAP),市值与换手率,换手率与残余波动率相关度临近0.5,提示潜在多重共线风险;

- 图3中一级因子相关度整体偏低,唯一较高的是换手率(liq)与波动率(vol)相关性为0.45,参考过往版本(CNE5)的处理经验,对其实施了两两正交处理。

此相关性分析是后续因子合成及回测调整的重要依据[page::6]。

2.5 规模因子(Size)(第7页)


  • 组成:由LNCAP(市值对数)和MIDCAP(中等市值,非线性项)构成,CNE6将两者合并为单一size因子;

- 发现:两个二级因子的收益方向不一致,特别是2015年以来收益表现明显背离,LNCAP表现下跌,MIDCAP则正向收益;
  • 调整策略:调整后将MIDCAP权重改为负向,整体提升规模因子表现;

- 数据指标:LNCAP累计收益-18.16%,最大回撤19.64%,夏普-0.8148;MIDCAP累计8.46%,胜率53.23%;size整体表现接近LNCAP,累计-9.38%,最大回撤24.66%,夏普比率-0.2298;
  • 图4显示LNCAP和MIDCAP趋势不同,且合成后的size与LNCAP走势更接近[page::7]。


2.6 波动率因子(Volatility)(第8页)


  • 组成:由BETA和Residual Volatility(残余波动率,由HSIGMA、DASTD、CMRA构成)共两部分构成;

- 观察:两个二级因子走势基本一致,但2016-2018年间Residual Volatility经历明显收益反转;
  • 合成波动率因子可提升收益率但同时增加波动率;

- 统计指标:BETA累计收益16.39%,夏普0.62,resvol累计16.27%,夏普0.33,合成vol累计29.32%,夏普0.46;
  • 图5表现波动率因子整体呈现收益增长趋势,但动荡显著[page::8]。


2.7 流动性因子(Liquidity)(第9-10页)


  • 组成:STOM(月换手率)、STOQ(季换手率)、STOA(年化交易量)、ATVR(新增因子);

- 相关性矩阵(图6)显示四个三级因子相关性较高,新增ATVR未破坏结构且有所提升;
  • 回测结果(表4)显示新增ATVR后,累计收益率较旧指标小幅提升,夏普率稍有改善;

- 图7对比两版流动性因子回测,新增版(liqnew)曲线略高于旧版(liqold),但整体依然表现负面,亏损严重且持续[page::9-10]。

2.8 估值因子(Value)(第10-11页)


  • 结构对比:CNE6在CNE5基础上增加了EM(企业倍数因子)和长期反转因子(Long Term Reversal, 由长期相对动量和历史Alpha组成);

- 回测表明合成后的估值因子提高了纯因子收益,但波动率也增长;
  • 统计指标:BTOP累计13.66%,ey累计13.36%,value整体累计24.98%,夏普0.4554;

- 图8展示价值因子持续回升趋势,尤其在2014年后明显改观[page::10-11]。

2.9 质量因子(Quality)(第11-12页)


  • 组成复杂,五个二级因子:Leverage(杠杆率)、Earnings Variability(盈利变动)、Earnings Quality(盈利质量)、Profitability(盈利能力)、Investment Quality(投资能力);

- 分析:因子间表现差异明显,Earnings Quality和Profitability两个因子收益稳定但方向相反,相互抵消;
  • 投资调整:调整Earnings Quality权重由正向改为负向改善合成质量因子收益;

- 统计数据:quality累计收益32.46%,年化2.76%,夏普0.6788,表现优异且较其他因子较稳健;
  • 图9显示质量因子及构成因子收益走势差异明显,lev和eq表现较弱,profit和iq较强[page::11-12]。


2.10 动量因子(Momentum)(第13页)


  • CNE6扩展自CNE5,仅含RSTR单因子,扩大至四个二级因子:Short Term Reversal(短期反转)、Seasonality(季节)、Industry Momentum(行业动量)和传统动量(由RSTR和HAlpha构成);

- 回测揭示短期反转贡献最大,是动量因子的主要收益来源;
  • 其他三个因子收益较弱但走势单调且相关性低,有利于多样化风险分散;

- 统计结果显示短期反转为-48.24%累计收益,夏普-1.95,收益明显为负,传统动量及季节因子表现平平;
  • 图10揭示整体动量因子收益较低且下跌明显,短期反转除外[page::13]。


2.11 成长因子(Growth)(第14页)


  • 与CNE5一致,由预测3年利润增长率(EGRLF)、每股净利润增长率(EGRO)及每股收入增长率(SGRO)组成;

- 纯因子回测历史收益不显著,累计收益为-3.91%,夏普-0.356,表现相对弱势;
  • 图11呈现基本平缓或弱势震荡走势,缺乏明显趋势[page::14]。


2.12 分红因子(Dividend Yield)(第14-15页)


  • 新增因子,由股息率(DTOP)和分析师预测股息率(DPIBS)构成,因数据缺失只用DTOP代理;

- 回测显示2014年以来分红因子贡献明显,值得关注;
  • 统计指标:累计收益8.21%,夏普0.7624,表现较为稳健;

- 图12展示分红因子自2014年开始持续上升趋势[page::14-15]。

2.13 调整合成权重后一级因子表现(第15-16页)


  • 结合前文二级因子分析,调整规模因子中MIDCAP因子权重由正转负,质量因子中的Earnings Quality同样调整;

- 调整后模型整体拟合度提升,Adjusted $R^{2}$由34%升至36%;
  • 调整在夏普比率提升明显,尤其规模因子和质量因子表现改善;

- 表10(16页)及图13显示调整后质量因子累计收益稳定在30%以上,规模因子收益负但波动下降,整体因子表现有所优化;
  • 动量和流动性因子依旧表现较差,尤其是流动性因子亏损严重[page::15-16]。


---

3. 图表深度解读



表1 & 图1(一级因子纯因子统计与回测结果)


  • 表1展示各因子收益及风控指标,反映流动性、动量因子整体负收益显著,质量因子是表现最佳因子。

- 图1曲线定量展现收益轨迹,质量因子持续增长,规模和成长因子跌幅显著,夏普比率正负差异明显支持该结论。
  • 图表协助直观对比各因子表现,强调质量因子优秀与流动性因子表现差强烈对比[page::4-5]。


图2&3(二级与一级因子相关性矩阵)


  • 图2及图3中大部分因子相关性处于合理区间(普遍小于0.5),避免模型多重共线性风险;

- 部分相关度较高因子进行正交处理,确保纯因子模型构建逻辑严密可靠;
  • 相关性矩阵为后续因子合成与权重调整提供数据支撑[page::6]。


表2 & 图4(规模因子)


  • 表2中LNCAP与MIDCAP的显著差异指示二者合成需谨慎调整。

- 图4展现自2015年后两者走势背离,MIDCAP成为规模因子调整的关键。
  • 结论为合成权重调整必要性提供实证数据依据[page::7]。


表3 & 图5(波动率因子)


  • 表3结果表明BETA与残余波动率单独表现相对稳定,合并后收益和波动均有所增加。

- 图5反映2016-2018年间的收益反转情况,提示风险。
  • 数据体现因子间波动风险需关注[page::8]。


表4 & 图6、7(流动性因子)


  • 表4展示新旧流动性因子变动,新增ATVR带来微幅收益提升。

- 图6为因子相关矩阵,体现较高相关性。
  • 图7回测曲线也体现出整体负收益。

- 反映流动性因素因市场环境和构建方式变化而表现欠佳,仍需优化[page::9-10]。

表5 & 图8(估值因子)


  • 表5展示多维估值因子对整体因子收益提升贡献及相对稳定性;

- 图8中价值因子趋势向好,尤其2014年后呈现明显上行。
  • 说明估值因子在选股中潜力显著提升[page::10-11]。


表6 & 图9(质量因子)


  • 表6细分质量子因子表现,盈利能力(profit)突出,盈利质量(eq)表现欠佳,但整体合成贡献正向,暗示需要权重调整;

- 图9曲线表现各子因子走势差异,支持收益方向相异且存在抵消效应的结论[page::11-12]。

表7 & 图10(动量因子)


  • 表7显示动量因子中短期反转收益大幅为负,其他子因子表现平平;

- 图10线形展现动量因子总体下滑,反映市场环境中动量策略在该组样本上效果欠佳;
  • 为动量因子改进提供思路[page::13]。


表8 & 图11(成长因子)


  • 层次分明的统计数据和图示,成长因子未能持续提供积极收益,收益稳定性差;

- 体现传统成长因子局限性[page::14]。

表9 & 图12(分红因子)


  • 新增分红因子通过股息率表现出稳定收益增长,特别是2014年后;

- 图12展现其正收益趋势,暗示其投资价值[page::14-15]。

表10 & 图13(调整后的纯因子模型)


  • 新模型权重调整后,调整前负向因子如MIDCAP、Earnings Quality权重被赋予负权,令规模因子和质量因子表现提升;

- 图13曲线也反映调整后因子收益曲线整体上移,尤其质量因子;
  • 显示因子权重调整带来的实际投资性能改善[page::15-16]。


---

4. 估值与模型改进分析


  • 报告未涉及传统股票估值方法(如DCF、P/E等),核心聚焦Barra多因子风险模型展现;

- 纯因子模型强调单因子暴露与中性控制,基于加权最小二乘、限制条件回归技术实现;
  • 调整因子权重基于历史因子收益表现,动态调整策略以提升模型拟合度(Adjusted $R^2$)及风险调整后收益(夏普率);

- 当前纯因子组合风险调整表现存在较大差距,模型改进重点放在权重调整及因子间相关性脉络梳理;
  • 计划后续结合机器学习、多因子指数增强应用深入挖掘[page::3-4,15-16]。


---

5. 风险因素评估


  • 报告明确指出模型随着市场环境变化可能失效,存在结构性风险;

- 具体表现为因子收益方向波动(如部分质量因子与规模因子近期回撤),因子之间动态相关性的变化及宏观经济结构调整风险;
  • 并未详述缓解策略,但通过调整因子权重和采用更加科学的因子合成框架是基本的应对路径;

- 强调持续更新模型因子参数和定期回测的重要性[page::0,16]。

---

6. 批判性视角与细微差别


  • 报告严谨地揭示多个因子回测期内表现不一,展示了模型的现实复杂性;

- 纯因子模型虽解决因子共线的问题,但仍无法保证未来市场中因子表现的稳定性;尤其质量和规模因子近期被发现表现异议,提示模型可能存在结构性时变风险;
  • 动量和流动性因子表现疲软,反映中国市场中这类传统因子可能不适用,或因市场微结构、投资者行为特殊性而削弱收益;

- 权重调整虽带来拟合度小幅改善,但仅微小提振因子表现,说明因子收益率本质受大周期影响,静态因子模型有局限;
  • 报告基于模型回测数据,未引用更多实盘业绩验证,存在模型-实际转化偏差风险;

- 由于回测数据基于2009-19年,未来市场策略需要动态适配,报告未来研究方向积极但实践中面临挑战。

---

7. 结论性综合



本报告以Barra CNE6风险模型为框架,基于纯因子暴露与约束回归方法,构建了覆盖规模、波动率、流动性、估值、质量、动量、成长及分红等领域的多层级纯因子组合。通过2009年至2019年10年多阶段的月度调仓回测,揭示了各类因子收益的差异性及其内在结构特征:
  • 质量因子表现良好且稳健(累计收益32.46%,夏普0.6788),为投资组合带来稳健正贡献;

- 估值因子融合企业倍数与长期逆转,收益和波动度均提升,显示组合多样化逻辑合理;
  • 规模因子存在子因子(LNCAP与MIDCAP)收益走向分歧,必要的权重调整后模型的拟合和表现均有所改善;

- 波动率和流动性因子回测呈现波动较大且流动性因子整体呈现负收益,提示流动性风险隐患;
  • 动量因子贡献主要来自短期反转,其他动量亚因子表现低迷,动量策略在本市场和时间段表现受限;

- 成长因子表现整体不显著,分红因子新增表现稳健,具有潜在投资价值;
  • 相关性分析确保模型中因子间多重共线性问题被有效控制,通过正交处理优化模型稳定性;

- 权重调整带来的拟合度和风险调整收益提升验证了基于广泛数据驱动的模型优化必要性;
  • 风险依然存在,市场环境变动可能导致模型失效。


综合来看,本报告通过纯因子构建与因子合成的深入研究,既揭示了CNE6因子体系中核心因子表现特征,也为后续风险模型的构建、指数增强及机器学习应用提供坚实量化基础。报告对因子效用的客观评估为资产管理者提供了调优方向和风险提示,是Barra多因子模型在中国A股市场应用的有益补充。

---

附:主要图表参考(Markdown形式引用)


  • 图1:一级因子纯因子回测结果

图1
  • 图2:二级因子相关性矩阵

图2
  • 图3:一级因子相关性矩阵

图3
  • 图4:规模因子纯因子回测结果

图4
  • 图5:波动率因子纯因子回测结果

图5
  • 图7:流动性因子纯因子回测结果

图7
  • 图8:估值因子纯因子回测结果

图8
  • 图9:质量因子纯因子回测结果

图9
  • 图10:动量因子纯因子回测结果

图10
  • 图11:成长因子纯因子回测结果

图11
  • 图12:分红因子纯因子回测结果

图12
  • 图13:调整后纯因子回测结果

图13

---

参照全文各章节及页码溯源,确保分析准确与全面。

报告