`

多因子报告之二:因子测试和多因子策略 1.0

创建于 更新于

摘要

本报告系统测试了近十年A股市场多类因子,包括估值、成长、经营质量、规模、量价及波动因子。通过因子收益、t值、IC及IR等多指标,多维度筛选并剔除多重共线性因子,最终构建7因子多因子模型。模型回测区间2011-2020年,年化收益19.4%,超额收益14.6%,表现稳健。未来计划引入宏观择时因子优化模型表现 [page::0][page::5][page::28][page::31]

速读内容


样本与方法论概述 [page::5][page::6]

  • 采用2011-2020年全部A股数据,剔除ST股和上市不足两年股票。

- 数据清洗采用Boxplot方法,因子标准化主要用Z-score标准化,回归方法主要采用加权最小二乘回归(WLS)和稳健回归(RLM)。
  • 因子有效性通过因子收益、t值、IC(信息系数)、IR(信息比率)综合评估。


因子测试与筛选流程 [page::7][page::28]

  • 从数百因子中,归纳11大类因子,如估值、规模、成长、质量、量价、波动等。

- 筛选标准包括:因子收益、IC及IC>0比例三项指标方向一致,t值绝对值阈值,多重共线性剔除,同类保留预测性较强因子,保证单调性及收益序列平稳。
  • 最终筛出7个因子:EP(ttm), BP(lyr), 预期ROEG,Liquid turnover, 对数市值,5日换手率,24mstd波动因子。


主要因子测试结果展示 [page::8][page::10][page::11][page::13][page::18][page::21][page::25][page::27]

  • 估值因子如BP(lyr)表现优异,具有明显正向收益和信息系数。

- 成长因子以预期ROEG为代表,回报有一定正向贡献,IC均值适中。
  • 经营质量因子Liquid turnover具备一定预测能力,正向收益结构明显。

- 规模因子中的对数市值具有较好解释力,相关性高,但回报呈负。
  • 量价因子换手率表现负收益,短期涨跌因子表现次之。

- 波动因子24mstd表现为负收益,信息系数偏低。

多元回归及因子权重确定 [page::29][page::31]

  • 采用分时截面回归和全样本回归方法分别估计因子权重。

- 分时截面回归体现更优组合表现,因子年化收益权重依次为BP(lyr)=4.54%、EP(ttm)=1.41%、liquid turnover=1.27%、预期roeg=0.86%、24mstd=-0.58%、对数市值=-8.34%、5换手率=-14.02%。
  • 因子权重图进一步展示两种回归方法的对比结果。


多因子组合回测结果及优化方向 [page::0][page::30][page::31]


  • 组合采用行业中性,调仓月频,每行业选择得分前5%股票,权重为市值与因子得分均值。

- 回测期间(2011-2020),扣除交易成本0.1%,组合总收益492.4%,年化收益19.4%,超额收益14.6%,夏普比率0.81。
  • 2018年因组合回撤较大,计划未来纳入宏观择时因子和因子波动完善模型。

深度阅读

金融工程报告之二:“因子测试和多因子策略1.0” 深度分析报告



---

一、元数据与报告概览


  • 报告标题:《多因子报告之二:因子测试和多因子策略 1.0》

- 发布日期:2021年4月23日
  • 发布机构:山西证券股份有限公司,金融工程研究所

- 作者团队
- 策略分析师:麻文宇 CFA
- 研究助理:翟子超 FRM
  • 报告主题:基于A股市场数据的多因子模型研究,围绕因子筛选、因子测试、权重确定及组合回测展开,构建并验证多因子组合1.0版本。

- 核心论点与结论
- 报告旨在基于山西证券自主构建的因子测试框架,分析数百个市场因子,筛选出7个有效因子,构建多因子模型,达到较好的收益表现。
- 多因子组合1.0在2011-2020年区间回测取得年化19.4%,超额收益14.6%,表现优异,但2018年回撤较大,拟加入宏观择时因子进行优化。
- 报告重视因子的统计有效性、单调性、平稳性及多重共线性,强调严格的因子筛选和稳健的多元回归定权方法。

综上,报告意图传递山西证券金融工程团队系统地测试和筛选因子,科学构建多因子组合策略的完整实践框架,并展现出初步成功的投资策略表现。[page::0] [page::5]

---

二、逐节深度解读



2.1 理论框架回顾与因子测试方法


  • 关键论点

- 多因子模型涵盖估值、规模、成长、质量、杠杆、动量、波动、技术、流动性、分析师等11大因子类别。
- 采用WLS加权最小二乘(市值平方根作为权重)与RLM稳健回归(迭代加权,减小异常值影响)测试因子收益稳定性和有效性。
- 通过IC(信息系数,反映因子当前暴露与未来收益的相关性)及IR(IC均值标准差比)测试因子稳定性。
- 采用因子分层回测检验因子收益的单调性,即是否能够将股票分组后的收益区分清楚。
  • 数据处理

- 数据样本是A股全部剔除ST、上市不足两年、长期停牌个股,测试期2011.1.1-2020.12.31。
- 数据清洗采用Boxplot法剔除异常值,因子标准化使用Z-score和max-min,因子暴露即为标准化后的因子值,表达股票对因子的敏感度。
  • 逻辑与假设

- 因子有效性检测通过因子收益的均值和t值,其时间序列的平稳性和单调性,判定因子能否稳定解释股价。
- 多重共线性检测确保因子间相互独立,避免过度拟合。
  • 图1框架流程说明

- 明确四大步骤:确定样本,数据清洗,因子测试,模型构建,重点是因子测试指标与模型构建的规范流程。[page::5] [page::6] [page::7]

---

2.2 因子风格测试详细结果



报告分五大类展示因子测试数据,每类选择效果最优的因子参与多因子组合。

2.2.1 估值因子


  • 资产负债相关估值因子包括

- EPttm(基于滚动TTM的盈利收益率)
- EP
lyr(基于静态LYR的盈利收益率)
- BPlyr(静态净资产收益率)
- SP
ttm/SPlyr(基于销售的估值收益率)
- CFP
ncfttm(经营现金流现金流收益率)
- dividendyield2(股息率)
- EBITDA
toEV(息税折旧摊销前利润与企业价值的比率)
  • 统计数据与结论

- BP
lyr月度因子收益最高(0.68%),t值显著(2.41),年化因子收益约8.5%。
- EPttm、SPttm等因子收益均为正,但t值弱,存在一定统计显著性不足。
- 图10显示不同估值因子滚动收益,BPlyr领先且较为稳健。
- 估值因子相关性表明EP
ttm与EPlyr高度相关(0.92),BPlyr与EPttm、SPttm存在适度相关(0.24-0.36)。
- IC值与IR分析表明BPlyr及SPttm表现较稳定,IC均值和正值比例较高。
  • 整体,估值因子中BPlyr表现最佳,其正向收益和显著性支持纳入组合。[page::8] [page::9] [page::10] [page::11]


2.2.2 成长因子


  • 包含预期ROEG、预期净利润增长率(g)、预期营收增长率三个因子。

- 因子收益较低且p值不显著,只有预期ROEG微弱正向(年化1.23%),预期营收g表现负向。
  • 成长因子相关性较低,说明各因子捕捉不同成长维度。

- 滚动收益图14显示预期ROEG相对平稳,有微弱上升趋势。
  • IC及IR分析中预期ROEG稳定性最高,其他因子较弱。


结论为成长因子整体效果较弱,但预期ROEG相对最佳,有加入价值。[page::11] [page::12] [page::13]

2.2.3 经营质量因子


  • 明显涵盖资产周转率、利润率等指标,包括流动资产周转率(Liquid turnover),总资产周转率,roe、roa,毛利率等。

- 大多数盈利率相关因子收益均为负,且统计不显著,说明这类财务质量指标预测效果有限。
  • 流动资产周转率因子(Liquid turnover)表现相对正面,年化正收益约1.73%,t值虽不强但优于其他质量因子。

- 相关性矩阵显示毛利率、净利率等和roe正相关,资产周转率类指标部分正相关,但整体指标预测力弱。
  • IC值和IR均显示质量因子多不具备有效性,部分因子IC负值。


质量因子测试提示质量类传统指标相关性高但预测力不足,仅Liquid turnover有一定潜力。[page::13] [page::14] [page::15] [page::16] [page::17] [page::18]

2.2.4 规模因子


  • 测试多维度规模指标:企业价值、总市值、自由流通市值、对数市值及其变形。

- 总体规模因子因子收益不强,部分为负,且统计显著不足。
  • 对数总资产表现较好(年化1.86%),总市值及企业价值略正但无显著性。

- 因子间相关性极高(超过0.9),说明规模因子高度重叠。
  • IC值和IR均表明大部分规模因子无显著预测作用,有负向信号的存在。


规模因子虽然广泛关注,但本研究发现其盈利预测效果有限,指标间高度相关,说明选用其中唯一代表即可。[page::19] [page::20] [page::21]

2.2.5 量价因子


  • 量价指标主要是不同期限换手率及涨跌幅。

- 换手率因子整体呈负收益,且统计显著,例如5日换手率年化收益达-13.8%,t值为-5.45,表明高换手率预示负收益。
  • 涨跌幅类因子表现正收益,尤其1月,3月涨跌幅因子(年化分别约3.18%、4.36%)统计显著。

- 因子间相关关系清晰,短期换手率高相关,涨跌幅正相关且负相关于换手率。
  • IC与IR表明换手率为负且稳健,涨跌幅为正且较稳健。


量价因子表明短期增量交易活跃负盈利能力,而中长期正收益的涨跌幅因子可能体现价格动量效应。[page::22] [page::23] [page::24] [page::25]

2.2.6 波动因子


  • 指24月和60月股价标准差及beta系数。

- 所有波动因子均表现为负向或接近零收益率,t值未显著。
  • 相关性中24mstd和60mstd高度相关(0.9以上),beta系数相关较低。

- IC与IR均弱,说明波动因子预测能力不足。
  • 滚动收益曲线也显示波动因子整体表现不佳。


波动因子在本研究中未展现稳健的预测功效,不作为主要因子考虑。[page::26] [page::27] [page::28]

---

2.3 多因子组合构建



2.3.1 因子筛选原则


  • 核心筛选条件:

- 因子收益、IC值及IC正向比例三者符号一致。
- 每种风格中因子收益t值最大或超过0.9。
- 因子之间多重共线性剔除冗余,保留IC值最大者。
- 因子具备单调性,时间序列因子收益平稳。
- 通过单位根检验保证平稳性。
  • 最终筛出7个因子:

- EP
ttm(估值)
- BPlyr(估值)
- 预期ROEG(成长)
- Liquid turnover(经营质量)
- 对数市值(规模)
- 5换手率(量价)
- 24mstd(波动)

2.3.2 多元回归评估因子权重


  • 使用分时截面多元回归(控制行业虚拟变量),回归因子收益和因子暴露,输出每期因子收益期望作为因子权重。

- 分时回归年化因子收益权重显示BP
lyr最高(4.54%),EPttm次之(1.41%),24mstd与对数市值权重呈负,5换手率权重最大负值(-14.02%),反映短期换手率负面效应。
  • 全样本回归(无时间序列划分)结果方向一致,但估值因子权重稍有不同。

- 图48显示因子权重分布,回归定权更具科学性,分时截面回归优于全样本回归。[page::28] [page::29]

2.3.3 因子收益与市值综合权重法


  • 多因子综合打分为每只股票因子暴露向量点乘因子收益向量,得分作为股票预期收益。

- 行业内选取得分前5%股票构成股票池。
  • 市值权重和得分权重取均值作为股票最终权重,避免小市值股票和行业权重过度集中。

- 该权重方法体现行业中性与规模约束。

2.3.4 回测结果


  • 回测区间:2011年1月1日至2020年12月31日,考虑0.1%交易成本。

- 多因子1.0组合实现累计收益492.4%,年化19.4%,年化超额收益14.6%,夏普比率0.81。
  • 图49、图50对比分时截面回归和全样本回归权重回测效果,前者明显优于后者,验证分时回归的稳健性。

- 报告指出2018年回撤较大,因宏观经济环境变化导致部分因子失效,计划加入宏观择时因子和波动择时因子优化模型。[page::30] [page::31]

---

三、图表深度解读



(以下为涵盖所有关键图表的浓缩解读)
  • 图1(框架流程图)明晰多因子模型构建四步骤。

- 图2-9(估值因子收益时序图):BP
lyr因子收益表现突出,明显优于其他估值指标,时序收益稳定,支持其核心地位。
  • 图10(估值因子滚动收益):累计收益显示BPlyr持续领先,值达到2.3倍左右。

- 图11-14(成长因子收益时序与滚动收益):预期ROEG表现最好,其他成长因子收益平凡或负向。
  • 图15-26(经营质量因子各维度收益时序及滚动收益):Liquid turnover表现较好,其他经营质量因子收益弱甚至负向,累计曲线显示质量因子收益整体较低。

- 图27-33(规模因子收益时序与滚动):对数总资产略优,整体规模因子表现无显著优势。
  • 图34-42(量价因子收益与滚动):换手率因子均为负收益,涨跌幅因子为正收益,体现动量效应。

- 图43-47(波动因子收益时序):所有波动因子无显著正向收益,表现不佳。
  • 图48(因子权重柱状图):视觉体现分时与全样本回归计算权重分布,强调分时回归对于负收益因子权重惩罚更明显且合理。

- 图49-50(回测累计收益):多因子组合相比沪深300指数获得较高收益,突显多因子模型优势。

图表展示了详尽的因子收益时序和统计指标,为选择及权重设定提供坚实的数理基础。[page::8-50]

---

四、估值分析



本报告不直接涉及传统公司估值(如DCF)等,而是基于多因子模型的定量因子价值评估,通过统计回归和因子收益衡量价值。

估值因子(如EP、BP)为多因子配置的一部分,通过回归赋予权重,实质上以因子收益率作为"期望收益率"估计,构建预期股票收益完成估值。因子之间通过多重共线检测优化,避免冗余风险。

最终通过因子多元截面回归确定各因子权重,结合行业中性处理和市值加权实现风险平衡合理的市场估值体系。

---

五、风险因素评估


  • 报告明确指出多因子策略在2018年遭遇较大回撤,主要风险来源于宏观经济环境变化,导致部分因子失效,说明:


1. 因子风险:单因子或多因子在不同市场环境周期的有效性不稳定。

2. 模型风险:多因子模型对市场结构变化的适应性有限,需动态调整。

3. 执行风险:存在调仓频率、交易成本、市场冲击等对回测结果可能产生的影响,报告用0.1%综合交易成本进行计入。
  • 缓解策略:


- 计划后续引入宏观择时因子、波动性择时因子以优化模型,提高策略的动态适应能力和回撤控制。

- 行业中性和市值加权的权重分配减低行业或市值类别偏差风险。

---

六、审慎视角与细微差别


  • 因子筛选环节基于统计显著性和稳健性保证了整体因子质量,但依赖历史十年数据,因子未来表现仍面临不确定性,尤其在宏观经济和市场结构发生大变动时。

- 多因子模型设计中,5换手率因子赋予负权,虽然符合“高换手率低收益”理论,但可能反映了市场流动性和交易行为的复杂机制,是否长期保持负向作用尚需观察。
  • 规模类因子表现普遍弱,可能与A股市场特征或因子定义方式有关,后续需探索更有效替代指标。

- 一些质量因子(如ROE等)收益偏负,可能反映了估值与盈利能力间复杂关系,简单财务指标不足以捕捉市场“预期”维度。
  • 报告对因子收益的t值和p值解读谨慎,但依然存在部分因子统计显著度不足,后续建议加入更多非线性和非传统因子探索。

- 多元回归模型假设线性关系但市场行为本质非线性,模型拟合优化后或可引入机器学习方法提升表现。
  • 目前模型主要基于单因子到多因子的线性聚合,短期内宏观环境波动较大会对因子稳定性产生较大影响。


---

七、结论性综合



本报告系统地以严谨的统计方法测试了涵盖估值、成长、质量、规模、量价及波动等11大类因子中的数百个细分因子,综合运用IC、IR检验,回归分析,因子分层回测等技术,筛选出7个核心有效因子用于构建多因子1.0组合。

深度分析表明:
  • 估值因子中BPlyr表现最优,带来核心收益贡献。

- 成长因子中预期ROEG较具潜力。
  • 经营质量因子以Liquid turnover相对有效。

- 规模类因子影响有限,出现负收益的对数市值纳入,可反映规模风险溢价。
  • 量价因子的换手率系呈负效应,涨跌幅具备正向预测力。

- 波动因子整体效果不佳。

利用分时截面多元回归方法,结合行业中性处理与市场市值权重,合理赋予因子权重,构建量化多因子打分体系。

回测结果显示,2011-2020年内,该多因子策略获得年化19.4%回报,超额年化收益14.6%,夏普比率0.81,明显跑赢沪深300,也体现了多因子组合的有效性和稳定性。

报告同时指出部分年份宏观环境驱动的因子失效风险,明确后续将引入宏观择时因子进行动态调整,作为模型优化方向。

总体,报告呈现了一个严谨、系统、数据驱动的多因子模型构建整体流程及实践示范,为资产管理者提供科学的多因子量化投资框架和操作指导。

---

参考图表示意


  • 图 1 测试流程框架流程图:



  • 图 10 估值因子滚动累计收益:



  • 图 14 成长因子滚动收益:



  • 图 42 量价因子滚动收益:



  • 图 47 波动因子滚动收益:



  • 图 48 因子权重分布:



  • 图 49 多因子组合与沪深300对比回测收益(分时截面回归权重):



  • 图 50 全样本回归权重回测效果:





---

结语



此份金融工程深度因子测试报告展现了业内严谨的多因子量化投资研究流程,融合了严密的统计学测试、行业中性控制及稳健回归技术,良好平衡了投资组合的收益与风险,呈现出方法论与实证的良好结合。其基于近十年A股数据的实践回测表明,精选且权重科学配置的多因子组合具有显著的超额收益能力,但须关注宏观环境和市场因子结构变化带来的模型风险。整体研究结果为资产管理和量化投资提供了可操作且基于数据验证的理论支持和实务路径。

[page::0-32]

报告