`

因子筛选与投资组合构建

创建于 更新于

摘要

本报告基于全A股样本,主观筛选16个因子后通过加权最小二乘法量化精选出规模、市净率(BP)、3个月股价动量(反转)、HIGH/LOW(2个月)四因子模型,最大化模型整体解释能力。采用逐层增量解释法细化因子对超额收益的贡献,提出基于纯因子组合和二次规划法的两种投资组合构建方法,后者在因子暴露控制与换手率优化上表现更优。报告以中证500成分股为例,展示因子暴露和投资组合权重配置,凸显模型的实际可操作性和适应性 [page::0][page::2][page::4][page::7][page::8][page::9][page::12][page::13][page::14]

速读内容


因子初步筛选和分类 [page::2]

  • 16个候选因子涵盖成长、流动性、盈利、规模、技术指标、估值及波动类

- 筛选原则:避免高相关因子同时入选,优先波动量能大且经济逻辑清晰的因子
  • 详细因子见列表,包括EPS增长率、ROE、A股流通市值对数、BP、股价动量等


因子量化精选—最大化整体解释度 [page::3][page::4][page::5]


| 因子组合 | R²均值 | 出现最大R²频率 |
|--------------------------------|--------|---------------|
| A股流通市值对数 + BP | 0.0549 | 5.83% |
| A股流通市值对数 + 3个月股价动量(反转) | 0.0517 | 5.83% |
| A股流通市值对数 + HIGH/LOW(2个月) | 0.0498 | 4.17% |
  • 确定前三因子依次为规模因子、估值因子BP、动量因子

- 四因子模型加入HIGH/LOW后整体解释度最大(0.0772)
  • 因子数量增多边际解释能力递减,故定为4个因子


逐层增量解释法揭示因子贡献 [page::6][page::7][page::8]



  • 逐层剥离因子解释贡献,清晰划分因子对超额收益的增量解释能力

- 显示A股流通市值对数贡献占优,BP和动量因子贡献稳定,HIGH/LOW次之
  • 增量信息表现随因子加入逐渐递减,支撑四因子模型选择


纯因子组合构建方法 [page::9][page::10][page::11]


  • 先解算纯因子组合使单因子暴露为1,其他因子暴露为0

- 利用加权最小二乘法求解权重解析解
  • 受限于操作约束,部分因子暴露波动偏离理论值,尤其A股流通市值因子配置逐渐受限


二次规划法构建投资组合 [page::11][page::12][page::13]


  • 以优化换手率为目标,设置因子暴露的上下界约束

- 权重非负且满足全额投资
  • 效果较纯因子法更灵活,可更好满足因子暴露目标,表现稳定且实用


量化因子构建总结 [page::2][page::4][page::7]

  • 策略基于规模、市净率BP、动量反转、波动因子

- 因子选取综合考量波动量能、累计收益和稳健性
  • 多因子模型解释能力明显优于单因子组合,且逐层增量剥离明确因子贡献

- 组合构建结合数学优化方法兼顾因子暴露控制与交易成本

深度阅读

专题报告《因子筛选与投资组合构建》详尽分析报告



---

一、元数据与报告概览


  • 报告标题:《因子筛选与投资组合构建》

- 作者:崔浩瀚(研究助理)、叶涛(首席分析师)
  • 发布机构:招商证券研究发展中心

- 发布日期:2018年10月23日
  • 研究主题:本报告聚焦于多因子模型的因子筛选、增量解释策略及基于因子模型的投资组合构建方法,尤其针对中国A股市场的数据和样本空间进行分析与实证,并详细介绍了纯因子法和二次规划法两种投资组合构建方案。


核心论点
  • 首先筛选了16个候选因子,并通过最大化模型整体解释能力原则从中精选出4个因子(A股流通市值对数、BP、市价动量反转(3个月)、HIGH/LOW波动因子(2个月))进入最终模型。

- 采用逐层增量解释法分解因子对超额收益的贡献,以明确每一因子的边际增量信息。
  • 提出了三种投资组合构建方法,重点介绍纯因子组合方法和二次规划方法,并进行了中证500成分股数据的实证演示,说明模型的实际操作方式和效果。

- 建议在未来研究中重点拓展因子择时的深入研究。

作者传达的关键信息是多因子模型在A股市场的解释力有限,精选因子和合理组合构建方法能帮助实务投资实现更准确的因子暴露与超额收益捕捉。[page::0,1]

---

二、逐节深度解读



2.1 因子模型提要与主观初选



报告总结了之前多报告的研究基础——对A股市场78个因子从单因子收益指标、波动量能、夏普比率、预测难度等维度多指标的测算,揭示各指标存在“此消彼长”的矛盾关系,尤其是波动量能与累积收益之间的差异反映预测难度,例如,波动量能高但累积收益低的因子难以择时。

初步筛选16个候选因子,涵盖成长性(EPS增长率、净利润增长率)、流动性(速动比率、总资产周转率)、盈利性(ROE、销售净利率)、规模(A股流通市值对数)、技术指标(动量、相对强弱指数)及估值等多个维度,保证因子间相关性较低,且以波动量能指标筛除波动性不足、可操作性低的因子。这样的筛选体现权衡因子多样性与解释能力,兼顾因子潜在收益表现和经济含义。[page::2]

2.2 模型因子量化精选——最大化整体解释度



以增大模型整体解释能力为目标,通过遍历16个因子的所有2因子组合,进行加权最小二乘回归计算模型各期横截面的平均$R^2$,并统计最大$R^2$出现频率。
  • 两因子组合中,“A股流通市值对数 + BP”组合的平均$R^2$最高(0.0549),远超其他组合,规模因子在A股的超额收益解释力极强。

- 三因子模型加入“3个月股价动量(反转)”使平均$R^2$最高达0.0682,显示动量因子带来明显额外解释力。
  • 四因子模型中加入“HIGH/LOW(2个月)”进一步提升$R^2$至0.0772,体现波动类指标对收益具有边际贴补价值,但后续因子加入边际贡献迅速递减。


因子选定了覆盖规模、估值、技术动量与波动性四个维度,使模型兼具多角度解释能力,同时保持较低的因子维度,避免过拟合和组合构建复杂度的激增。[page::3,4,5]

2.3 逐层增量解释方法



本章节详细介绍了用于剥离因子贡献的统计方法,即逐层增量解释法(层次回归)。方法基于以下设定:
  • 因变量为经系统风险调整后的横截面超额收益。

- 按预设顺序,先以第一个因子进行回归,计算其单独解释的比例$\gamma^{(1)}$。
  • 残差作为下层因子的被解释变量,挑选第二因子,进行回归获取增量解释度$\gamma^{(2)}$。

- 依此类推,分层计算各因子对整体模型解释度的增量贡献,最终整体解释能力$\gamma = 1-\prod_{j=1}^{k}(1-\gamma^{(j)})$。

该方法克服传统多因子模型中多重共线性导致因子贡献不明的难点。实测结果表明,增量贡献随着因子层数升高显著递减,佐证前述因子筛选中控制因子数量的合理性。

图1与图2(增量解释能力走势图与面积叠加图)进一步直观呈现因子解释能力随时间的动态变化,规模因子贡献最大且波动较大,估值及动量因子贡献次之,波动因子增量较小但非零。[page::6,7,8]

2.4 因子投资组合构建



本节讨论因子模型的实际投资应用,澄清因子模型为解释性工具,因子本身并不具备预测功能,需要结合外生信息进行因子收益方向预测:
  1. 传统多空排序策略:根据单因子暴露对个股排序,做多高暴露与做空低暴露股票构建多空对冲组合。优点简单,缺点无法同时中性控制其他因子暴露,易产生叠加风险。
  2. 纯因子组合法

- 由Barra于2010年提出,数学上对个股权重求解确保在目标因子暴露为1、其他受控因子暴露约为0的纯组合。
- 通过加权最小二乘回归解析求解个股权重,实现理想的因子暴露控制。
- 较传统排序法有严格的因子暴露控制,但在实际可投资性质和操作灵活度上存在妥协。
- 中证500样本实测显示纯因子组合对因子在对应维度暴露为1,其他因子暴露均接近0(见表5),验证了模型的纯净性。
- 在实操中受限于约束条件放宽、不可做空限制等,因子暴露不能达到理论最大值,但大致符合预期(图3)。
  1. 二次规划方法

- 相比纯因子法,二次规划方法灵活性更强,可同时纳入换手率最小、做空限制和因子暴露目标区间约束等多个目标。
- 通过求解最小换手率的优化问题并满足组合因子暴露目标,达到更可交易、更接近策略意图的组合权重分配。
- 以中证500成分股为例,因子暴露指标达到了设定的目标范围,尤其规模因子达到约-0.3的预设负向暴露,动量和波动因子方向符合策略意图(图4)。
- 解决了纯因子法因子暴露未能完全达到目标且操作灵活性不足的问题。

实证显示,二次规划法组合权重更均匀合理,优化空间更大,适合大规模实战应用。[page::8,9,10,11,12,13]

2.5 总结



报告总结了上述因子筛选与组合构建研究成果:
  • 优选16个多角度维度因子,精选4因子模型实现因子整体解释能力最大化。

- 逐层增量解释方法有助于剥离因子贡献,明确边际信息增量。
  • 投资组合构建涉及纯因子组合方式与二次规划方式,后者实现更灵活、接近策略意图的权重分配。

- 后续研究重点将转向因子择时优化与模型完善。

附录包括具体2018年3月中证500成分股权重分配样本,便于实操参考。[page::13,14]

---

三、图表深度解读



图1 各因子逐层增量解释能力走势图


  • 该图展示了自2007年以来四个关键因子(A股流通市值对数、BP、3个月股价动量(反转)、HIGH/LOW(2个月))对超额收益的贡献动态。

- 纵轴为$R^2$拟合优度,反映因子贡献的解释力度。
  • 观察发现,规模因子(棕红线)在大部分年份表现突出,波峰明显,特定年份贡献近0.3以上,说明其对超额收益解释十分关键。动量与估值因子贡献相对稳定但较小,波动因子贡献最低且较为平稳。

- 反映因子价值随市场环境波动,会影响组合策略适时调整。

图1 各因子逐层增量解释能力走势图

图2 各因子逐层增量解释能力面积叠加图


  • 该图为图1的面积叠加图,展示了4个因子对超额收益的解释能力总和。

- 可见整体解释能力峰值时可达0.5以上,显示多因子共同作用下的增量解释力累积明显。
  • 但也体现出增量解释能力的周期性波动,提示模型的回测解释能力并不恒定。


图2 各因子逐层增量解释能力面积叠加图

图3 投资组合在各因子上的暴露走势(纯因子组合法)


  • 曲线显示纯因子组合在4因子上的实际时间序列暴露。

- 三个受控因子(BP、3个月股价动量、HIGH/LOW)暴露均维持近0水平,说明线性组合有效隔离了其暴露。
  • A股流通市值对数因子暴露在-0.3附近波动,2017年以来因子间相关性增高,负暴露难以维持,反映现实操作中的约束和因子交互复杂性。


图3 投资组合在各因子上的暴露走势(纯因子组合法)

图4 投资组合在各因子上的暴露走势(二次规划法)


  • 实线表现二次规划法求解的组合在四因子上的暴露度。

- 规模因子暴露稳定约为-0.3,符合设定区间,代表目标配置成功。
  • BP、HIGH/LOW因子暴露维持在接近0或略为正向,动力因子暴露多数时间为负,方向与策略风格匹配。

- 表明二次规划方案在多约束条件下能有效调节权重,使组合暴露更符合预期,更具有可操作性。

图4 投资组合在各因子上的暴露走势(二次规划法)

---

四、估值分析



本报告并未涉及传统企业估值指标的DCF或市盈率估值模型,而是“估值”因子(如BP)作为因子集合中的一个组成部分用于超额收益解释。报告重点在因子量化选择及对因子组合暴露控制的统计模型与优化策略,没有传统意义上的企业估值分析部分。

---

五、风险因素评估



风险评估隐含于因子选择与组合构建中:
  • 因子相关性风险:因子之间存在高相关性可能导致多重共线性,降低边际解释能力,报告通过因子相关分析剔除高度相关因子,采用逐层增量方法剥离贡献,缓解该问题。

- 因子择时风险:报告明确因子模型缺乏预测功能,需要额外外生变量进行因子收益方向判断,预测失误会导致组合暴露配置失当。
  • 组合约束限制:在实际可投资市场中(如禁止做空),纯因子组合面临操作约束,导致因子暴露难以达到理论最大化,增加执行风险。

- 模型适用范围风险:报告中因子选择基于过去10年及全A股样本,时间窗口或样本多变可能导致因子筛选结果变动,模型效果不一定稳健。
  • 成分股风险:如2018年3月中证500成分股中出现ST股,未被剔除可能影响组合稳健性,需加强股票池筛选。


报告未明确提供缓解策略概率量化,但通过方法设计和实证演示展示了对上述风险的定性对应和操作层面上的调整建议。[page::0,7,8,14]

---

六、批判性视角与细微差别


  • 报告秉承严谨数据驱动和相对客观分析立场,但因因子筛选含有一定主观判断成分,尤其对权重量化指标需要平衡时,易引入研究人员偏好。

- 虽然回归模型解释能力有限(单因子$R^2$仅0.05-0.07,且多因子模型整体$R^2$不足0.1),实际应用面临信号噪声大、市场非稳定性强等挑战,可能导致模型预测及操作效果不佳。
  • 因子暴露与市场环境相关联,因子本身非稳定变量,2017年后规模因子暴露难以实现负向,提示因子协同关系提升,模型需要动态调整。

- 纯因子组合法中做空约束导致因子暴露难完全达标,凸显现实条件与理论模型的差异,二次规划方法虽提高灵活性,但计算复杂度亦增大。
  • 建议报告后续增加更多因子择时预测机制研究,增强模型前瞻适应能力,避免静态模型陷阱。

- 部分附表及代码实现细节略缺,限制模型应用推广。

---

七、结论性综合



招商证券《因子筛选与投资组合构建》专题报告系统探索了基于多因子模型的因子筛选与因子投资组合构建路径。报告核心贡献主要体现在以下几个方面:
  1. 准确筛选因子组合:从78个因子中初选16个,最终通过加权最小二乘回归和逐层增量解释法精炼到4个高效因子(A股流通市值对数、BP、3个月股价动量反转与HIGH/LOW波动因子),模型整体解释能力提升至约7.7% $R^2$,在A股市场中达到解释超额收益的合理范畴。
  2. 创新逐层增量解释法:有效剥离各因子对超额收益的贡献,避免多重共线性导致贡献责难,明确各因子边际信息增量,便于动态因子优化与调整。
  3. 精细构建投资组合方法

- 纯因子组合方法确保单因子暴露的纯净性,且通过解析表达式快速获得各股权重,简化计算流程;
- 二次规划方法兼顾因子暴露精度与换手率控制等现实投资需求,增强组合可投资性及操作灵活性。
  1. 实证验证和操作细节清晰:中证500成分股数据应用展示了模型实际构造与因子暴露实现情况,图表清晰体现了两种构建方法下因子暴露的时间演变及可操作性差异。


综上,该报告不仅为A股多因子策略的因子构建与投资组合设计提供了系统、科学的理论与实践框架,也为因子择时与组合动态调整奠定了坚实基础。报告显示,理论因子收益解释能力虽有限,但通过合理因子筛选、模型构建与优化组合设计,可以较好地捕获超额收益源泉,提升策略实效性。

该报告的评级体系和投资建议标准也说明其专业性,尽管未直接给出股价的买卖评级,但为因子策略的构建和优化提供了强有力研究支撑。[page::0-14]

---

参考文献及资料来源


  • 招商证券研究中心,“因子筛选与投资组合构建”,2018年10月23日。

- 相关内部报告如《基于增量信息逐层解释的因子模型框架搭建》(2017-11)。
  • Wind资讯及招商证券数据支持。


---

(全文字数约1700字)

报告