`

如何评价因子最合理?——不同因子绩效方法与因子动量组合比较

创建于 更新于

摘要

本报告系统评析了传统因子IC、Rank IC、MAE及改进的Rank MAE等多种因子绩效评价方法,揭示传统IC方法对中间收益组股票贡献不足的缺陷,提出Rank MAE方法可有效均衡不同收益分位数贡献及适用于深度学习loss函数。基于各绩效方法构建的因子动量组合进行了全面回测,结果显示Rank MAE在控制组合波动率和最大回撤方面优势明显,尤其在叠加换手率和多重约束的指数增强组合中表现稳健,综合信息比有所提升。报告还详细分析了不同因子绩效权重分配差异及极端收益股票对绩效的影响,为后续优化组合构建及因子提炼提供理论与实证支持。[page::0][page::7][page::11][page::13][page::18]

速读内容

  • 传统因子IC评价存在中间收益分组贡献度趋近于零的问题,导致因子无法有效区分收益中间区域股票绩效,影响组合构建效果。


- 不同收益分位数股票对IC贡献差异极大,极端收益组贡献显著,中间组几乎无贡献。[page::7]
  • Rank IC方法基于秩相关度,部分改善了收益中间组贡献问题,但极端收益组贡献仍较大,且该方法不可导,难用于深度学习优化。



[page::8][page::9]
  • MAE评价相较Rank IC贡献差异更大,但最大贡献值集中度较Rank IC低,分布更为平滑。且与收益波动存在一定差异。



[page::9][page::10]
  • 改进Rank MAE方法通过对Rank进行标准化后计算MAE,显著缩窄不同收益分位数贡献的差异度,极值贡献更均衡,且可作可导loss函数适用于深度学习。





[page::11][page::12]
  • 不同因子绩效方法构建因子动量组合后,纯多头组合表现中线性回归方法年化收益最高,但叠加30%换手限制后,Rank MAE方法的超额收益及信息比表现最佳,且最大回撤较低。

| 组合方法 | 年化超额(考虑成本) | 信息比 | 最大回撤 | 收益回撤比 |
|---------|-------------------|--------|--------|----------|
| 线性回归 | 7.84% | 0.479 | 29.00% | 0.270 |
| Rank IC | 6.11% | 0.371 | 33.12% | 0.184 |
| e^(-rank mae) | 5.85% | 0.375 | 31.31% | 0.187 |
| e^(-mean(rank mae)) | 6.60% | 0.422 | 31.13% | 0.212 |


[page::13][page::14]
  • 指数增强组合中,Rank MAE在中证500、中证1000、沪深300宽严约束条件下均表现出较好的风险控制能力,显著降低最大回撤,提升信息比,年化收益略低于线性回归法。







[page::15][page::16][page::17]
  • 不同方法下因子权重分布差异显著:线性回归法权重波动大、偏重量价因子;Rank MAE权重分布近似均等,波动小,有利于组合稳定。

- 剔除极端收益股票后,线性回归法因子绩效和权重波动较大,Rank MAE方法受影响极小,提示Rank MAE更稳定且受约束条件影响较小。[page::17][page::18]
  • 总结认为,Rank MAE作为因子绩效评价和动量权重计算方法,更加均衡地反映各收益分位贡献,兼容深度学习方法损失函数,能够在复杂约束及换手环境下提升组合风险控制能力,未来有望结合更复杂模型进一步改进。[page::18][page::19]

深度阅读

金融研究报告详尽分析报告



---

1. 元数据与概览


  • 报告标题:如何评价因子最合理?——不同因子绩效方法与因子动量组合比较

- 分析师:郑雅斌、余浩淼
  • 发布机构:海通证券研究所

- 发布日期:2025年3月
  • 研究主题:本报告围绕量化投资中的多因子模型,重点探讨因子绩效评价的不同方法(IC、Rank IC、MAE及改进MAE等),并基于这些评价构建因子动量组合,比较不同方法对组合表现的影响,进而提出适合深度学习及量化策略的因子评价标准[page::0,5,6]。


核心论点总结:

  • 当前传统的因子绩效指标(如IC)存在中间分组无效的问题,导致对收益靠近均值的股票区分能力不足。

- 通过引入Rank MAE等改进指标,可以更均衡地衡量不同收益分位股票对因子绩效的贡献,有利于构建更稳健的因子动量组合。
  • 基于Rank MAE的因子绩效动量组合在控制回撤和波动方面表现更佳,尤其在添加交易成本和组合约束后优势明显。

- 传统线性回归系数动量尽管收益较高,但换手成本和风险控制较差,且因子权重分布不均;而Rank MAE赋予因子较均衡权重,更符合实际投资约束需求[page::0,6,11,13,14]。

---

2. 逐节深度解读



2.1 常见多因子组合构建方法(第1章)


  • 多因子组合建设通常通过最大化预期收益加权和,并结合线性约束(如换手率、市值等)实现最优化。关键在于准确估计股票的预期收益(EstR)和合理设定约束条件。

- 因子动量构建基于历史因子暴露值与股票收益回归,采用加权最小二乘(WLS)回归计算因子收益,预计未来收益。线性回归模型伴随着假设与损失函数的选择,可能影响因子收益的合理评估[page::5,6]。

2.2 因子绩效方法与特性(第2章)



2.2.1 因子IC方法


  • 采用传统因子IC(截面相关系数)分解个股贡献时发现,中间收益分位(接近均值的股票)对IC的贡献近乎于零,而极端收益分组贡献显著更大。

- 这种特性导致因子IC无法充分反映中间组股票的区分能力,使得因子在此部分表现无效,衍生出因子选择时的盲区。
  • 因子IC等同于线性回归系数,故线性回归中同样存在此无效问题[page::6,7]。


图解:

  • 图1展示不同收益分位数股票对IC贡献的分布,显示收益极值组贡献大,中间组几乎无贡献。



  • 图2表明极端组股票的贡献均值和中位数较高,中间组趋近零,强化上述结论。


2.2.2 因子Rank IC方法


  • Rank IC用秩相关关系替代简单相关,可以减少收益接近均值时贡献趋于零的问题,使各分位贡献较均匀。

- 但极端收益分位股票贡献的极小值依然显著高于其他分位数,说明极端值仍然权重较大,且Rank IC不能作为可导函数用于深度学习。
  • 图3图4显示Rank IC贡献分布更均匀,但依旧存在极端值贡献偏重现象[page::8,9]。


图解:


  • 图3体现Rank IC贡献在不同收益分位较均匀分布,极端与中间组贡献差距减小。



  • 图4展示贡献的中位数与均值接近,但极小值的极端差异仍存在。




2.2.3 因子MAE方法


  • MAE(平均绝对误差)作为机器学习中的常用loss函数,直接衡量因子暴露与收益的绝对偏差,是一种效果较为稳健的因子评价指标。

- MAE贡献在不同收益分位差异较Rank IC更大,但整体区间较宽且峰度更为明显,表明中间组贡献情况优于IC方法。
  • 图5图6反映了MAE贡献在不同收益分组中的具体差异表现[page::9,10]。


图解:


  • 图5显示MAE贡献在极端与中间分位上差异明显,但整体贡献不像IC那样趋近零。



  • 图6体现MAE贡献的均值和中位数差异区间较小。




2.2.4 改进MAE(Rank MAE)方法


  • 由于收益率和因子值分布形态不同,直接MAE计算可能存在偏差,因此对因子暴露和收益均先取排名(Rank)并标准化后计算MAE,进一步消除了偏度峰度的不均衡影响。

- Rank MAE对不同收益分位的贡献更均匀极值差异最小,具备良好的稳定性和可导性(因子值体现了排名),特别适合深度学习loss函数。
  • 图7图8分别展示Rank MAE个股贡献分布和平滑性。





  • 进一步考虑中性化因子值与收益率Rank计算MAE,贡献曲线成现图9图10所示,表现更平滑均匀[page::11,12]。


图解:


  • 图9显示中性化因子暴露-收益率Rank MAE的贡献分布,较之前指标更为均匀。



  • 图10进一步量化了贡献的最大、均值、中位数。





表2数据梳理整体贡献差异性,对比了IC、Rank IC、MAE、Rank MAE及因子值收益Rank MAE方法的统计指标,结论清晰:



| 指标 | IC | Rank IC | MAE | Rank MAE | 因子值-收益Rank MAE |
|-------|------------|---------|---------|-----------|-------------------|
| 中位数最大-最小差 | 0.343% | 0.031% | 0.121% | 0.024% | 0.034% |
| 均值最大-最小差 | 0.344% | 0.046% | 0.117% | 0.024% | 0.029% |
| 最大-最小最小值差 | 0.078% | 0.125% | 0.134% | 0.049% | 0.051% |
  • 由此Rank MAE及因子值-收益Rank MAE差异度最小,贡献趋于均匀,利于模型稳定训练与组合构建[page::12,13]。


---

2.3 基于不同因子绩效方法的因子动量组合构建及表现(第3章)



3.1 选取Alpha因子及构建因子动量组合


  • 选取多类alpha因子,包括市值、复合基本面(ROE、SUE)、分红、低频量价、高频量价因子及深度学习衍生因子。

- 基于四种因子绩效动量方法:线性回归系数动量、Rank IC 动量、$e^{-\text{rank mae}}$动量、$e^{-\text{mean(rank mae)}}$动量,与因子暴露Rank计算预期收益。
  • $e^{-\cdot}$的应用是因为MAE值越小因子预测表现越好,故取负指数进行转换以形成因子权重[page::12,13]。


3.2 全市场多头组合表现


  • 构建等权选100只股票的全市场纯多头组合,分别采用四种绩效动量因子方法进行测试,考察不计与计交易成本下的超额年化收益、信息比、最大回撤及收益回撤比。
  • 表3显示

- 不计交易成本时,线性回归动量表现最好,年化超额23.72%,信息比1.297;
- Rank IC及两种MAE方法表现略逊。
- 计交易成本后,收益均显著下降,皆因频繁换手成本较高。
  • 叠加30%换手率限制后(表4、图11-12),$e^{-\text{rank mae}}$和$e^{-\text{mean(rank mae)}}$组合表现超过传统方法,年化超额13%左右,信息比0.83以上,回撤有所控制:





  • 说明换手约束下,Rank MAE方法更适合实际投资约束,表现更稳定[page::13,14]。


3.3 不同指数增强组合表现(中证500、中证1000、沪深300)


  • 各指数结合宽严不同约束(详见表5),用四类因子绩效方法对组合进行构建。
  • 中证500增强(表6,图13-16):

- 线性回归收益最高,Rank MAE方法回撤最低,信息比相近;
- 严格约束下Rank MAE优势更明显。




  • 中证1000增强(表7,图17-20):

- Rank MAE方法的信息比明显优于线性回归,最大回撤也有良好控制;
- 年化超额收益趋同线性回归方法,表现稳健。




  • 沪深300增强(表8,图21-24):

- Rank MAE有效抑制波动和最大回撤;
- 虽然严约束下收益有所下降,但信息比及风险调整表现更优。




  • 总结:Rank MAE方法整体提升组合风险调整表现,尤其在强调约束管理和成本控制时优势显著[page::14,15,16,17]。


3.4 因子权重分析


  • 表9-10及后续分析揭示线性回归方法因子权重分布显著不均,大量权重集中在低/高频量价类因子,且历史波动较大。

- Rank MAE方法则赋予因子非常均衡且稳定的权重,历史偏离均值和波动率极小,接近等权分配。
  • 去除收益极端数据后,线性回归因子绩效和权重波动显著增加,说明极端收益对其影响敏感且脆弱。

- 相反,Rank MAE方法在剔除极端值后权重变动极小,对极端值更稳健。
  • 说明线性回归方法对极端收益过分依赖,导致组合表现波动大且可能对约束条件敏感;Rank MAE因其稳健性在实际组合构建中更具优势,尤其在多约束环境下表现更优[page::17,18]。


---

3. 图表深度解读



此报告的图表体系完整详实,包含了不同因子绩效评价方法在收益分位不同情况下的单股贡献分布(图1-10),以及因子绩效动量组合在不同约束条件和不同指数范畴的表现(图11-24)。

图1-2(IC方法贡献分布)


  • 极端收益分位贡献最大且正负两极分化明显,中间组贡献几乎为零,揭示了因子IC的中间组无效问题。

- 最大贡献值高达约0.34%,对应极端收益分位,说明IC评价存在“极值驱动”倾向[page::7]。

图3-4(Rank IC贡献分布)


  • Rank IC贡献分布更加均匀,中间分位组贡献不再零,但极端分位最小值仍存在显著的负偏离,体现出一定的极端权重依然存在。

- 图中极端负值可能导致过分强调极端组股票,影响整体稳健性[page::8,9]。

图5-6(MAE贡献分布)


  • MAE在极端分位和中间分位均表现出一定的贡献,极端变动幅度更大,表明其对极端收益有响应,但对中间分位仍有可识别能力[page::9,10]。


图7-10(Rank MAE贡献分布)


  • Rank MAE贡献极值较小,差异度最低,体现出最佳的分布均衡性与稳定性。

- 图9-10进一步通过采用因子值与收益的Rank差分,解决了标准MAE过度依赖极端值的问题,是一种逻辑完整且适配深度学习的因子评价指标[page::11,12]。

图11-24(因子绩效动量组合表现)


  • 图11-12展示换手限制下全市场多头组合净值与年度表现,体现换手约束对组合收益稳定性的提升。

- 图13-16(中证500)、图17-20(中证1000)、图21-24(沪深300)显示不同约束下增强组合整体走势,Rank MAE方法回撤显著降低,信息比提升,表明该方法能更好控制风险。
  • 组合净值曲线清晰展现所有因子绩效方法的趋势,进一步佐证了本文结论的实证基础[page::14-17]。


---

4. 估值分析



报告聚焦于因子绩效评价及因子组合表现,未涉及传统的企业估值模型或现金流折现模型。其核心价值在于优化量化因子权重与组合构建过程,从根本上提升多因子模型的收益率和风险调整水平。

---

5. 风险因素评估


  • 报告在开篇与结尾均提醒所有分析均基于公开信息,不构成投资建议,强调权益类产品波动大,适合有风险承受能力的投资者。

- 模型选取因子及构建均基于历史数据,未来因市况变化、不同时间段效果可能产生波动。
  • 交易成本及换手率对组合收益产生显著影响,缺乏充分控制将导致实际表现远逊模型预期。

- 极端收益样本对基于线性回归的因子绩效影响较大,可能造成模型不稳定风险,隐含市场“黑天鹅”风险加大。
  • Rank MAE虽稳健但在深度学习环境中的稳定性仍需实盘验证[page::0,20].


---

6. 批判性视角与细微差别


  • 报告本身承认传统线性回归方法的假设(如等权加权历史回归系数计算等)较为简化,未充分考虑因约束条件对股票预期收益计算的影响,提示未来模型可进一步优化(引入加权、深度学习等新技术)。

- 线性回归和IC指标偏重极端收益样本,反映了统计学中的“重尾”风险问题,对于模型稳健性是潜在隐患。
  • Rank IC不可导制约了其在神经网络等非线性模型中的应用,显示传统金融指标和现代机器学习手段的天然矛盾。

- 现有因子线性组合预测能力偏低,因子IC数值低,暗示量化因子存在较大噪声,需开拓新型因子或多因子非线性组合策略。
  • 报告假设因子动量构建方法和因子权重均较为理想,实际市场操作中市场流动性、资金量限制等因素可能影响最终组合有效性。

- 在剔除极端值的分析中,线性回归方法权重变化剧烈,而Rank MAE更稳健,反映线性回归对极端值过度敏感的问题,提示现实投资中需谨慎权重调整[page::18,19]。

---

7. 结论性综合



本报告系统、深入地揭示了传统因子IC评价方法存在的核心缺陷,即收益中间分位股票贡献趋零导致的中间组无效问题。通过引入Rank MAE及其变体,报告提出了一种统计上更加均衡、适用于深度学习框架的因子绩效评估指标。
  • 技术贡献

- 定量分析了多种因子绩效指标的单股票贡献分布及对因子权重的影响。
- 实证比较不同因子动量组合在无约束、换手限制及指数增强条件下的表现,验证Rank MAE体系能更好控制风险,提高信息比,尤其在约束和换手约束中优势明显。
  • 关键数据显示

- Rank MAE与因子值-收益Rank MAE表现出贡献度分布最均衡,极致分位与中间分位贡献差异最小(表2)。
- 约束条件下,Rank MAE构建的组合波动率、最大回撤显著降低,信息比接近或优于线性回归基线(表4,6,7,8)。
- Rank MAE赋予因子权重极为均匀且稳定,使组合更适应实际投资环境,减少极端权重带来的风险。
- 剔除极端收益样本后,Rank MAE因子权重变化小,线性回归法权重波动剧烈,显示Rank MAE稳健性优越。
  • 投资与应用建议

- 在量化投资中,应摒弃单纯基于IC线性回归的因子绩效评价,优先考虑Rank MAE及其改进方法。
- 尤其在换手率、组合约束严格背景下,Rank MAE因子动量组合有更好风险收益平衡。
- 未来研究应结合更复杂非线性模型(如深度学习、树模型)替代单一历史动量,提高因子预测能力。
- 相关模型构建应充分考虑极端值影响和目标损失函数的优化属性,避免过度拟合极端收益样本。

综上,报告提供了一套理论充分、实证支持的量化因子绩效评价和动量组合构建新范式,既填补了传统IC评价的不足,也为机器学习方法深度融合因子投资提供了路径,具有显著的学术和实务价值[page::0-20]。

---

参考关键图表及图片



| 图表编号 | 说明 | 页码 |
|----------|------------------------------------------|--------|
| 图1 | 不同收益分位数下,股票不同因子暴露分位数IC贡献 | 7 |
| 图2 | 不同收益分位数下股票IC贡献均值、中位数、最大值 | 7 |
| 图3 | 不同收益分位数下,股票不同因子暴露分位数Rank IC贡献 | 8 |
| 图4 | 不同收益分位数下股票Rank IC贡献均值、中位数、最小值 | 9 |
| 图5 | 不同收益分位数下,股票不同因子暴露分位数MAE贡献 | 9 |
| 图6 | 不同收益分位数下股票MAE贡献均值、中位数、最小值 | 10 |
| 图7 | 不同收益分位数下,股票不同因子暴露分位数Rank MAE贡献 | 11 |
| 图8 | 不同收益分位数下股票Rank MAE贡献均值、中位数、最小值 | 11 |
| 图9 | 不同收益分位数下,股票不同因子暴露分位数因子暴露-收益率Rank MAE贡献 | 12 |
| 图10 | 不同收益分位数下股票因子暴露-收益率Rank MAE贡献均值、中位数、最小值 | 12 |
| 图11-24 | 不同约束条件与指数下因子动量组合的表现曲线及年度收益 | 14-17 |

(图均已通过正文关键段落详细剖析并链接)

---

总结



本报告通过详尽比较多种因子绩效评价方法,指出传统IC与线性回归方法在中间收益分组下存在显著评价缺陷,提出基于Rank MAE的新型评价指标并验证其稳定性和应用优势。实证结果证明Rank MAE基于因子动量的组合构建能有效提升风险调整后收益,尤其在约束下表现更优。该方法具备良好导数特性,适宜结合深度学习等非线性模型,是未来智能量化投资的有力工具。报告兼顾理论深度与实用价值,是多因子研究和量化策略优化的重要参考。

---

【全文溯源】[page::0,1,2,5-20]

报告