`

选股因子系列研究(七十三)——使用基本面逻辑改进 ROE 因子

创建于 更新于

摘要

本报告针对最新披露 ROE 因子滞后于当期真实 ROE 的选股效果不足问题,提出结合一致预期 ROE 及 ROE 历史波动率倒数加权两步法提升预测当期真实 ROE 精度。实证结果显示,新构建的 ROE 因子在因子 IC 和月均溢价上均较传统最新披露 ROE 有约50%的提升,更接近理论最优的当期真实 ROE,显著增强选股能力。同时,不同行业ROE波动特征差异明显,未来有进一步细化行业模型空间 [page::0][page::4][page::7][page::10][page::13]

速读内容

  • 传统最新披露 ROE 因子由于财报时延,常滞后反映当期真实 ROE,选股效果明显弱于当期真实 ROE,且最新披露 ROE 的选股有效性部分来自业绩动量效应,ROE 自相关系数约为0.5-0.9之间,存在持续性 [page::4][page::5][page::6]。

- 剔除财报空窗期(2-4月)对最新披露 ROE 选股效果影响不大,财报空窗期不是两者差异的主要原因 [page::5]。
  • 通过一致预期 ROE 与最新披露 ROE 联合预测当期真实 ROE,预测误差(MAE, RMSE)显著降低,且预测因子 IC 和多空收益均超越单独使用最新披露 ROE,提升了选股效果。

  • 一致预期 ROE 数据覆盖度有限(30%-80%不等),且因分析师研究关注偏向热门股,导致一致预期 ROE 选股效果在剔除估值和技术因子之后下降明显 [page::7]。

- 针对 ROE 历史波动性对预测准确度的影响,采用K-Median方法剔除波动率极端高的股票,剔除后最新披露 ROE 对当期真实 ROE 预测误差显著下降,尤其在全市场范围内效果明显,但在沪深300与中证500效果一般 [page::9]。
  • 引入波动率倒数加权方法调整最新披露 ROE,将较高波动率股票权重调低,得到波动率调整 ROE,预测误差进一步降低,选股 IC、胜率、收益均有所提升,提升了因子稳定性和有效性。

| 指标 | 旧方法 | 波动率倒数加权后 |
|-------------|---------|------------------|
| IC均值 | 0.026 | 0.030 |
| IC胜率 | 69.4% | 77.6% |
| 多空收益 | 1.11% | 1.18% |
  • 将一致预期 ROE 与波动率调整后的最新披露 ROE 联合回归预测当期真实 ROE,成为最优预测因子,IC 较最新披露 ROE 有50%左右提升,多空收益、胜率均显著提高,越接近理论最优选股效果。

  • ROE 波动率存在显著行业差异,周期行业(有色金属、煤炭、钢铁等)波动显著偏高,传媒行业ROE波动率与商誉占比高度相关,商誉减值监管提高波动性,对ROE预测提出行业差异化要求。


  • 本报告提出基于基本面核心逻辑的因子改进方法,先精准预测当期真实ROE,再以预测值构建因子,效果和稳定性优于纯数据挖掘方式,具有推广意义,但仍有进一步提升的空间,尤其考虑行业特性细化模型 [page::0][page::14].

深度阅读

报告标题与概览



报告标题:《选股因子系列研究(七十三)——使用基本面逻辑改进 ROE 因子》
发布日期:2021年3月5日
发布机构:海通证券研究所
分析师:冯佳睿、余浩淼
主题:基于基本面逻辑提升ROE(净资产收益率)选股因子的投资价值和预测能力

核心论点:
  • 传统使用“最新披露 ROE”作为因子存在明显滞后,难以准确反映当期真实企业盈利能力,导致选股效果逊色。

- 结合“最新披露 ROE”与“分析师一致预期 ROE”,并对历史 ROE 波动率进行调整,可以显著提升当期真实 ROE 的预测精度,从而大幅优化基于ROE的选股能力。
  • 新构建的ROE预测因子,在因子IC(信息系数)和月均溢价等指标上相较传统“最新披露ROE”提升约50%。

- 该方法基于对基本面数据的更精准预测,而非单纯依赖数据挖掘,因而有望带来更稳定且较优的投资效果。

风险提示包括:市场系统性风险、模型假设误设风险、有效因子变动风险。[page::0,14]

---

目录及结构概览



报告结构清晰,分为六大部分:
  1. ROE 选股效果初探

2. 结合一致预期 ROE 的当期真实 ROE 预测
  1. ROE 高波动股票对预测效果的影响

4. ROE 波动率的行业差异
  1. 总结与讨论

6. 风险提示

此外提供了丰富的表格和图示支持分析,确保了研究的深度和数据严谨性。[page::1]

---

1. ROE 选股效果初探



1.1 最新披露 ROE 与当期真实 ROE 的选股效果对比


  • 关键论点: 由于财报披露时滞(季度财报至少滞后一个月,年报滞后达4个月),市场只能用最新披露的ROE作为因子,导致与实际的当期真实ROE存在显著时差。这种滞后损害了选股效果。

- 关键数据(表1):
- 当期真实ROE的IC均值显著高于最新披露ROE,季度单季度ROE选股效果比TTM更优,且表现胜率均超70%以上,远超最新披露ROE。
  • 逻辑解释: 财报空窗期使得市场的信息滞后且不完备,最新披露ROE可能不反应近期实际经营状态,但仍保持一定选股效果,推测是业绩的“动量效应”在起作用。

- 动量效应定义: 上一季度ROE较高的公司更有可能在下一季度维持较好业绩。[page::4]

1.2 财报空窗期的影响


  • 分析: 通过剔除2-4月财报空窗期,发现对最新披露ROE和真实ROE的IC及选股胜率无显著影响,推断空窗期不是迟滞主要原因。

- 结论: 业绩动量效应和信息时滞本质因素仍需关注。[page::5]

1.3 业绩动量效应验证


  • 数据: 表3显示季度滑动平均ROE自相关系数高达0.86-0.95,单季度ROE约0.5左右,表明ROE自相关性显著。

- 表4进一步分析: 通过正交方法剔除动量因素后,最新披露ROE的选股能力大幅降低,反映出最新披露ROE具有部分预测当期真实ROE的功能,但动量成分贡献巨大。
  • 结论: 最新披露ROE成为当期真实ROE的有限但有效预测,但仍有改进空间。[page::5-6]


---

2. 结合一致预期ROE提升预测



2.1 一致预期 ROE 与当期真实 ROE 相关性


  • 覆盖率问题:一致预期ROE覆盖率仅全市场30%-40%,沪深300最高约80%,限制了因子普适性。

- 相关性分析(表5): 一致预期ROE与真实ROE相关系数0.63左右,高于最新披露ROE的0.51,且去除最新披露ROE影响后仍保持较高相关度。
  • 选股效果(表6): 一致预期ROE单独用作因子时IC值较低,且经行业、估值等技术面因子剔除后IC几乎归零,显示该因子单独选股能力弱,推测是分析师偏好积极股票导致数据偏差。

- 结论: 虽有信息含量,但表现有限,需结合其他信息源提升预测准确度。[page::6-7]

2.2 结合双因子回归预测当期真实ROE


  • 方法: 以过去12个月每月最新披露ROE+一致预期ROE作为自变量,回归当期真实ROE,得到预测模型。

- 效果(表7): 结合模型在MAE、RMSE、R^2均显著优于单纯用最新披露ROE,说明一致预期ROE作为增量信息有效提升预测精度。
  • 选股效果验证(表8、图2、表9):

- 预测当期ROE作为因子,无论IC均值(0.033 vs 0.026)、月均溢价(1.37% vs 1.11%)及胜率均优于最新披露ROE。
- 累计因子溢价图表显示该预测因子表现稳定且长期优于传统因子,特别2017年后提升更明显。
  • 结论: 结合一致预期ROE大幅提升ROE因子的选股价值,尽管受限覆盖度及数据偏差,仍为完善选股因子提供有力路径。[page::7-9]


---

3. ROE高波动股票影响与波动率加权改进



3.1 剔除高波动股票


  • 理由: 高波动ROE个股最新披露ROE预测当期真实ROE精度差,影响整体效果。

- 方法: 以四季度ROE滑动平均标准差作为波动率指标,分类剔除波动性超标股票,计算预测误差(表10)。
  • 结果: 剔除后全市场MAE、RMSE改进明显,沪深300、中证500效果改善有限,反映大盘蓝筹较稳定,波动影响不大。

- 选股效果(表11): 剔除波动大股票后最新披露ROE的IC明显提升,尤其全市场范围显著。
  • 结论: 波动率是参考指标,剔除极高波动股票可提升预测能力,但代价是缩小选股池,不够理想。[page::9]


3.2 引入波动率倒数加权法


  • 方法: 利用波动率倒数(标准差倒数)加权最新披露ROE,降低高波动股票信号权重,使其“接近均值”,降低高噪声贡献。

- 效果(表12、表13): 加权后指标MAE、RMSE均显著改善,因子IC、胜率及多头收益均较原始最新披露ROE提升(全市场IC从0.026提高到0.030,胜率从69.4%提升至77.6%)。
  • 结论: 利用波动率倒数加权更温和、有效地调整了因子信号质量,提升了因子稳定性与预测能力。[page::9-10]


3.3 结合一致预期ROE的波动率加权预测


  • 思路: 将结合最新披露+一致预期ROE预测值,进行波动率倒数加权,进一步提升预测的准确性。

- 效果(表14): 加权后MAE、RMSE均较未加权组合模型明显改善,R^2提升使预测更精准。
  • 选股效果(表15、图3、表16):

- 统计全市场及分市场数据,采用波动率加权后的联合预测因子IC均优于其他方法,提升最为显著,收益表现更稳健。
- 2016年后,改进效果尤其突出,体现策略动态应对市场变化能力。
  • 总结: 结合业绩预期与历史信息,通过波动率调整优化信号权重,是提升ROE因子表现的关键步骤。[page::10-12]


---

4. ROE波动率的行业差异分析


  • 发现: ROE波动率存在明显的行业异质性,周期性行业如有色金属、房地产、煤炭、钢铁等极端波动股票比例高,同时这些行业加权权重偏离市场均值较大。

- 原因猜测: 该类行业受宏观经济周期影响大,盈利波动明显且同向变动特征明显,导致ROE波动大。
  • 传媒行业特殊案例: 该行业ROE高波动区别于周期,主要源于高商誉占比及基于PE的商誉估值方法。

- 数据支撑(表17、图4、图5):
- 传媒行业商誉比例与ROE波动权重相关系数显著高于市场整体,且2018年监管加强后关联上升。
  • 结论: 不同行业ROE波动背后原因不同,需针对行业特征开发差异化预测模型,提高ROE预测精度。[page::12-13]


---

5. 总结与讨论


  • 研究意义: 随着A股市场效率提升,ROE因子成为热门且重要的基本面选股因子。传统最新披露ROE因滞后性而效果受限。本文通过结合一致预期数据和波动率加权,提升了当期真实ROE的预测能力,进而改善因子的选股表现。

- 成果亮点: 新因子IC和月均溢价提升约50%,多头收益、空头收益均优化,更接近理论最佳预测因子效果。
  • 未来方向: 依然存在空间提升,尤其是分行业专项模型可以进一步提高预测准确率和选股效果。

- 逻辑总结图阐释: 对未来最理想数据(当期真实ROE)不可直接获取,基于最新披露ROE自相关性,采取一致预期数据和波动率调整两条路径,同时优化最终因子性能。[page::13]

---

6. 风险提示


  • 市场系统性风险:市场整体变动可能影响因子表现。

- 模型误设风险:模型假设可能存在偏差或不符合未来市场实际。
  • 有效因子变动风险:因子有效性可能因市场风格或结构变化而减弱。[page::14]


---

图表解读



表1 & 表2:最新披露ROE与当期真实ROE选股效果比较


  • 反映最新披露ROE由于信息滞后,选股性能逊于当期真实ROE。

- 剔除财报空窗期影响后,选股差异仍存在,表明空窗期非主因。

表3 & 表4:ROE自相关与动量贡献分析


  • ROE具显著自相关性,单季度ROE自相关约0.5,预计选股中动量贡献显著。

- 剔除动量成分后,最新披露ROE选股效果明显下降,显示动量为重要驱动。

表5 & 表6:一致预期ROE的相关性与选股效果


  • 一致预期ROE与真实ROE相关较强(0.6左右),但单独作为因子效果弱。

- 受限于覆盖率低及数据偏差,纯用难取得好选股表现。

表7至表9 & 图2:结合一致预期ROE预测提升效果


  • 结合回归模型,预测误差降低(MAE与RMSE均改善)。

- 选股IC和多空收益提升明显,图2显示累计因子增值优于传统做法,尤其2017年之后。

表10 & 表11:剔除高波动股票的预测性能改善


  • 全市场剔除高波动股票后预测误差显著下降。

- 大盘蓝筹因业绩稳定,剔除效果不大。

表12 & 表13:波动率倒数加权改进预测


  • 加权后MAE、RMSE降低,IC和胜率等选股指标提升显著。

- 多头收益改善,显示稳定性提升。

表14 & 表15 & 图3 & 表16:波动率加权结合一致预期ROE预测的最优效果


  • 预测误差最低、IC及收益率最高,超过其他所有单因子或组合因子。

- 图3累计因子溢价曲线领先,分年表现尤为稳定,特别迎合近年市场环境。

表17 & 图4、图5:行业ROE波动及其成因


  • 周期行业和传媒行业ROE波动显著高于其他行业。

- 传媒行业ROE波动与商誉占比高度相关,体现行业特性对模型设计的重要性。

图6:基本面逻辑改进ROE因子流程示意


  • 体现基于理论理想的当期真实ROE,利用最新披露ROE通过波动率调整与一致预期数据叠加,提高预测准确性,最终形成改进因子。


---

批判性视角与细微差别


  • 报告充分利用丰富数据与多角度验证方法,实证分析完善。

- 一致预期ROE因覆盖率不足和卖方分析师偏好效应,单独使用效果不佳,报告对此未夸大,描述客观。
  • 剔除高波动股票虽提升了因子质量,但缩小了投资范围,且波动率强依赖择优的参数设定,存在一定政策风险。

- 报告提到行业差异,建议进一步行业细分因子开发,但未展开具体方法论。未来工作可涵盖更多行业定制建模。
  • 预测模型基于历史回归,隐含未来市场稳定性的假设,面临模型风险和结构突变风险。


综上,该报告提供了以系统化方法改进ROE因子的清晰路径和验证,实用性强,但需关注模型制定中的潜在风险和行业差异带来的复杂性。

---

结论性综合



海通证券的本份研究报告系统分析了传统ROE因子在A股选股中的局限性,尤其是最新披露ROE的时间滞后问题对选股效果的拖累。通过创新性地结合分析师一致预期ROE数据与基于历史ROE波动率的倒数加权调整,研究成功构造了更加接近当期真实ROE的预测因子。

实证结果显示:
  • 结合预期与波动率加权的联合预测因子在IC (信息系数)、选股胜率及月均超额收益率等核心指标上,相较传统的最新披露ROE提高约50%,显著提升量化选股的有效性。

- 预测模型在全市场及沪深300、中证500等不同市场范围均保持优异表现,特别是在近几年市场环境中作用更为明显。
  • 行业分析揭示不同行业ROE波动成因不同,周期性行业多波动与经济周期相关,传媒业波动则与商誉估值机制有关,指明未来分行业针对性模型开发方向。


此外,报告图谱直观展现了因子改进的逻辑链条与演进过程,验证数据样本跨度长、方法严谨。风险提示涵盖市场与模型风险,保持了分析的客观审慎。整体而言,该报告不仅为ROE因子优化提供了实用方法论,也深化了对基本面因子时效性与预测技术的认知,具备较高的理论和实务参考价值。[page::0,4-14]

---

重要图表参考



朝阳永续一致预期 ROE覆盖度,显示数据源覆盖有限,影响因子广泛应用。

预测当期ROE较传统指标表现更优的累计因子溢价曲线。

多种ROE预测方法的因子溢价累积净值图,展示波动率加权联合预测领先性。

不同行业ROE波动率极端数占比与波动率权重偏离均值,突出周期性行业波动显著。

传媒行业商誉占比与ROE波动权重相关系数,体现特殊行业波动来源。

使用基本面思维改进ROE选股效果的逻辑链条,清晰展示方法论框架。

---

综上,该研究为基于基本面的ROE因子预测施以创新的时效提升方案,方法科学、数据扎实,既有理论深度也具实务指导意义,值得投资量化研究者深入学习和应用。[page::0-14]

报告