选股因子系列研究(七十三)——使用基本面逻辑改进 ROE 因子
创建于 更新于
摘要
本报告针对最新披露 ROE 因子滞后于当期真实 ROE 的选股效果不足问题,提出结合一致预期 ROE 及 ROE 历史波动率倒数加权两步法提升预测当期真实 ROE 精度。实证结果显示,新构建的 ROE 因子在因子 IC 和月均溢价上均较传统最新披露 ROE 有约50%的提升,更接近理论最优的当期真实 ROE,显著增强选股能力。同时,不同行业ROE波动特征差异明显,未来有进一步细化行业模型空间 [page::0][page::4][page::7][page::10][page::13]
速读内容
- 传统最新披露 ROE 因子由于财报时延,常滞后反映当期真实 ROE,选股效果明显弱于当期真实 ROE,且最新披露 ROE 的选股有效性部分来自业绩动量效应,ROE 自相关系数约为0.5-0.9之间,存在持续性 [page::4][page::5][page::6]。
- 剔除财报空窗期(2-4月)对最新披露 ROE 选股效果影响不大,财报空窗期不是两者差异的主要原因 [page::5]。
- 通过一致预期 ROE 与最新披露 ROE 联合预测当期真实 ROE,预测误差(MAE, RMSE)显著降低,且预测因子 IC 和多空收益均超越单独使用最新披露 ROE,提升了选股效果。

- 一致预期 ROE 数据覆盖度有限(30%-80%不等),且因分析师研究关注偏向热门股,导致一致预期 ROE 选股效果在剔除估值和技术因子之后下降明显 [page::7]。
- 针对 ROE 历史波动性对预测准确度的影响,采用K-Median方法剔除波动率极端高的股票,剔除后最新披露 ROE 对当期真实 ROE 预测误差显著下降,尤其在全市场范围内效果明显,但在沪深300与中证500效果一般 [page::9]。
- 引入波动率倒数加权方法调整最新披露 ROE,将较高波动率股票权重调低,得到波动率调整 ROE,预测误差进一步降低,选股 IC、胜率、收益均有所提升,提升了因子稳定性和有效性。
| 指标 | 旧方法 | 波动率倒数加权后 |
|-------------|---------|------------------|
| IC均值 | 0.026 | 0.030 |
| IC胜率 | 69.4% | 77.6% |
| 多空收益 | 1.11% | 1.18% |

- 将一致预期 ROE 与波动率调整后的最新披露 ROE 联合回归预测当期真实 ROE,成为最优预测因子,IC 较最新披露 ROE 有50%左右提升,多空收益、胜率均显著提高,越接近理论最优选股效果。

- ROE 波动率存在显著行业差异,周期行业(有色金属、煤炭、钢铁等)波动显著偏高,传媒行业ROE波动率与商誉占比高度相关,商誉减值监管提高波动性,对ROE预测提出行业差异化要求。


- 本报告提出基于基本面核心逻辑的因子改进方法,先精准预测当期真实ROE,再以预测值构建因子,效果和稳定性优于纯数据挖掘方式,具有推广意义,但仍有进一步提升的空间,尤其考虑行业特性细化模型 [page::0][page::14].
深度阅读
报告标题与概览
报告标题:《选股因子系列研究(七十三)——使用基本面逻辑改进 ROE 因子》
发布日期:2021年3月5日
发布机构:海通证券研究所
分析师:冯佳睿、余浩淼
主题:基于基本面逻辑提升ROE(净资产收益率)选股因子的投资价值和预测能力
核心论点:
- 传统使用“最新披露 ROE”作为因子存在明显滞后,难以准确反映当期真实企业盈利能力,导致选股效果逊色。
- 结合“最新披露 ROE”与“分析师一致预期 ROE”,并对历史 ROE 波动率进行调整,可以显著提升当期真实 ROE 的预测精度,从而大幅优化基于ROE的选股能力。
- 新构建的ROE预测因子,在因子IC(信息系数)和月均溢价等指标上相较传统“最新披露ROE”提升约50%。
- 该方法基于对基本面数据的更精准预测,而非单纯依赖数据挖掘,因而有望带来更稳定且较优的投资效果。
风险提示包括:市场系统性风险、模型假设误设风险、有效因子变动风险。[page::0,14]
---
目录及结构概览
报告结构清晰,分为六大部分:
- ROE 选股效果初探
2. 结合一致预期 ROE 的当期真实 ROE 预测
- ROE 高波动股票对预测效果的影响
4. ROE 波动率的行业差异
- 总结与讨论
6. 风险提示
此外提供了丰富的表格和图示支持分析,确保了研究的深度和数据严谨性。[page::1]
---
1. ROE 选股效果初探
1.1 最新披露 ROE 与当期真实 ROE 的选股效果对比
- 关键论点: 由于财报披露时滞(季度财报至少滞后一个月,年报滞后达4个月),市场只能用最新披露的ROE作为因子,导致与实际的当期真实ROE存在显著时差。这种滞后损害了选股效果。
- 关键数据(表1):
- 当期真实ROE的IC均值显著高于最新披露ROE,季度单季度ROE选股效果比TTM更优,且表现胜率均超70%以上,远超最新披露ROE。
- 逻辑解释: 财报空窗期使得市场的信息滞后且不完备,最新披露ROE可能不反应近期实际经营状态,但仍保持一定选股效果,推测是业绩的“动量效应”在起作用。
- 动量效应定义: 上一季度ROE较高的公司更有可能在下一季度维持较好业绩。[page::4]
1.2 财报空窗期的影响
- 分析: 通过剔除2-4月财报空窗期,发现对最新披露ROE和真实ROE的IC及选股胜率无显著影响,推断空窗期不是迟滞主要原因。
- 结论: 业绩动量效应和信息时滞本质因素仍需关注。[page::5]
1.3 业绩动量效应验证
- 数据: 表3显示季度滑动平均ROE自相关系数高达0.86-0.95,单季度ROE约0.5左右,表明ROE自相关性显著。
- 表4进一步分析: 通过正交方法剔除动量因素后,最新披露ROE的选股能力大幅降低,反映出最新披露ROE具有部分预测当期真实ROE的功能,但动量成分贡献巨大。
- 结论: 最新披露ROE成为当期真实ROE的有限但有效预测,但仍有改进空间。[page::5-6]
---
2. 结合一致预期ROE提升预测
2.1 一致预期 ROE 与当期真实 ROE 相关性
- 覆盖率问题:一致预期ROE覆盖率仅全市场30%-40%,沪深300最高约80%,限制了因子普适性。
- 相关性分析(表5): 一致预期ROE与真实ROE相关系数0.63左右,高于最新披露ROE的0.51,且去除最新披露ROE影响后仍保持较高相关度。
- 选股效果(表6): 一致预期ROE单独用作因子时IC值较低,且经行业、估值等技术面因子剔除后IC几乎归零,显示该因子单独选股能力弱,推测是分析师偏好积极股票导致数据偏差。
- 结论: 虽有信息含量,但表现有限,需结合其他信息源提升预测准确度。[page::6-7]
2.2 结合双因子回归预测当期真实ROE
- 方法: 以过去12个月每月最新披露ROE+一致预期ROE作为自变量,回归当期真实ROE,得到预测模型。
- 效果(表7): 结合模型在MAE、RMSE、R^2均显著优于单纯用最新披露ROE,说明一致预期ROE作为增量信息有效提升预测精度。
- 选股效果验证(表8、图2、表9):
- 预测当期ROE作为因子,无论IC均值(0.033 vs 0.026)、月均溢价(1.37% vs 1.11%)及胜率均优于最新披露ROE。
- 累计因子溢价图表显示该预测因子表现稳定且长期优于传统因子,特别2017年后提升更明显。
- 结论: 结合一致预期ROE大幅提升ROE因子的选股价值,尽管受限覆盖度及数据偏差,仍为完善选股因子提供有力路径。[page::7-9]
---
3. ROE高波动股票影响与波动率加权改进
3.1 剔除高波动股票
- 理由: 高波动ROE个股最新披露ROE预测当期真实ROE精度差,影响整体效果。
- 方法: 以四季度ROE滑动平均标准差作为波动率指标,分类剔除波动性超标股票,计算预测误差(表10)。
- 结果: 剔除后全市场MAE、RMSE改进明显,沪深300、中证500效果改善有限,反映大盘蓝筹较稳定,波动影响不大。
- 选股效果(表11): 剔除波动大股票后最新披露ROE的IC明显提升,尤其全市场范围显著。
- 结论: 波动率是参考指标,剔除极高波动股票可提升预测能力,但代价是缩小选股池,不够理想。[page::9]
3.2 引入波动率倒数加权法
- 方法: 利用波动率倒数(标准差倒数)加权最新披露ROE,降低高波动股票信号权重,使其“接近均值”,降低高噪声贡献。
- 效果(表12、表13): 加权后指标MAE、RMSE均显著改善,因子IC、胜率及多头收益均较原始最新披露ROE提升(全市场IC从0.026提高到0.030,胜率从69.4%提升至77.6%)。
- 结论: 利用波动率倒数加权更温和、有效地调整了因子信号质量,提升了因子稳定性与预测能力。[page::9-10]
3.3 结合一致预期ROE的波动率加权预测
- 思路: 将结合最新披露+一致预期ROE预测值,进行波动率倒数加权,进一步提升预测的准确性。
- 效果(表14): 加权后MAE、RMSE均较未加权组合模型明显改善,R^2提升使预测更精准。
- 选股效果(表15、图3、表16):
- 统计全市场及分市场数据,采用波动率加权后的联合预测因子IC均优于其他方法,提升最为显著,收益表现更稳健。
- 2016年后,改进效果尤其突出,体现策略动态应对市场变化能力。
- 总结: 结合业绩预期与历史信息,通过波动率调整优化信号权重,是提升ROE因子表现的关键步骤。[page::10-12]
---
4. ROE波动率的行业差异分析
- 发现: ROE波动率存在明显的行业异质性,周期性行业如有色金属、房地产、煤炭、钢铁等极端波动股票比例高,同时这些行业加权权重偏离市场均值较大。
- 原因猜测: 该类行业受宏观经济周期影响大,盈利波动明显且同向变动特征明显,导致ROE波动大。
- 传媒行业特殊案例: 该行业ROE高波动区别于周期,主要源于高商誉占比及基于PE的商誉估值方法。
- 数据支撑(表17、图4、图5):
- 传媒行业商誉比例与ROE波动权重相关系数显著高于市场整体,且2018年监管加强后关联上升。
- 结论: 不同行业ROE波动背后原因不同,需针对行业特征开发差异化预测模型,提高ROE预测精度。[page::12-13]
---
5. 总结与讨论
- 研究意义: 随着A股市场效率提升,ROE因子成为热门且重要的基本面选股因子。传统最新披露ROE因滞后性而效果受限。本文通过结合一致预期数据和波动率加权,提升了当期真实ROE的预测能力,进而改善因子的选股表现。
- 成果亮点: 新因子IC和月均溢价提升约50%,多头收益、空头收益均优化,更接近理论最佳预测因子效果。
- 未来方向: 依然存在空间提升,尤其是分行业专项模型可以进一步提高预测准确率和选股效果。
- 逻辑总结图阐释: 对未来最理想数据(当期真实ROE)不可直接获取,基于最新披露ROE自相关性,采取一致预期数据和波动率调整两条路径,同时优化最终因子性能。[page::13]
---
6. 风险提示
- 市场系统性风险:市场整体变动可能影响因子表现。
- 模型误设风险:模型假设可能存在偏差或不符合未来市场实际。
- 有效因子变动风险:因子有效性可能因市场风格或结构变化而减弱。[page::14]
---
图表解读
表1 & 表2:最新披露ROE与当期真实ROE选股效果比较
- 反映最新披露ROE由于信息滞后,选股性能逊于当期真实ROE。
- 剔除财报空窗期影响后,选股差异仍存在,表明空窗期非主因。
表3 & 表4:ROE自相关与动量贡献分析
- ROE具显著自相关性,单季度ROE自相关约0.5,预计选股中动量贡献显著。
- 剔除动量成分后,最新披露ROE选股效果明显下降,显示动量为重要驱动。
表5 & 表6:一致预期ROE的相关性与选股效果
- 一致预期ROE与真实ROE相关较强(0.6左右),但单独作为因子效果弱。
- 受限于覆盖率低及数据偏差,纯用难取得好选股表现。
表7至表9 & 图2:结合一致预期ROE预测提升效果
- 结合回归模型,预测误差降低(MAE与RMSE均改善)。
- 选股IC和多空收益提升明显,图2显示累计因子增值优于传统做法,尤其2017年之后。
表10 & 表11:剔除高波动股票的预测性能改善
- 全市场剔除高波动股票后预测误差显著下降。
- 大盘蓝筹因业绩稳定,剔除效果不大。
表12 & 表13:波动率倒数加权改进预测
- 加权后MAE、RMSE降低,IC和胜率等选股指标提升显著。
- 多头收益改善,显示稳定性提升。
表14 & 表15 & 图3 & 表16:波动率加权结合一致预期ROE预测的最优效果
- 预测误差最低、IC及收益率最高,超过其他所有单因子或组合因子。
- 图3累计因子溢价曲线领先,分年表现尤为稳定,特别迎合近年市场环境。
表17 & 图4、图5:行业ROE波动及其成因
- 周期行业和传媒行业ROE波动显著高于其他行业。
- 传媒行业ROE波动与商誉占比高度相关,体现行业特性对模型设计的重要性。
图6:基本面逻辑改进ROE因子流程示意
- 体现基于理论理想的当期真实ROE,利用最新披露ROE通过波动率调整与一致预期数据叠加,提高预测准确性,最终形成改进因子。
---
批判性视角与细微差别
- 报告充分利用丰富数据与多角度验证方法,实证分析完善。
- 一致预期ROE因覆盖率不足和卖方分析师偏好效应,单独使用效果不佳,报告对此未夸大,描述客观。
- 剔除高波动股票虽提升了因子质量,但缩小了投资范围,且波动率强依赖择优的参数设定,存在一定政策风险。
- 报告提到行业差异,建议进一步行业细分因子开发,但未展开具体方法论。未来工作可涵盖更多行业定制建模。
- 预测模型基于历史回归,隐含未来市场稳定性的假设,面临模型风险和结构突变风险。
综上,该报告提供了以系统化方法改进ROE因子的清晰路径和验证,实用性强,但需关注模型制定中的潜在风险和行业差异带来的复杂性。
---
结论性综合
海通证券的本份研究报告系统分析了传统ROE因子在A股选股中的局限性,尤其是最新披露ROE的时间滞后问题对选股效果的拖累。通过创新性地结合分析师一致预期ROE数据与基于历史ROE波动率的倒数加权调整,研究成功构造了更加接近当期真实ROE的预测因子。
实证结果显示:
- 结合预期与波动率加权的联合预测因子在IC (信息系数)、选股胜率及月均超额收益率等核心指标上,相较传统的最新披露ROE提高约50%,显著提升量化选股的有效性。
- 预测模型在全市场及沪深300、中证500等不同市场范围均保持优异表现,特别是在近几年市场环境中作用更为明显。
- 行业分析揭示不同行业ROE波动成因不同,周期性行业多波动与经济周期相关,传媒业波动则与商誉估值机制有关,指明未来分行业针对性模型开发方向。
此外,报告图谱直观展现了因子改进的逻辑链条与演进过程,验证数据样本跨度长、方法严谨。风险提示涵盖市场与模型风险,保持了分析的客观审慎。整体而言,该报告不仅为ROE因子优化提供了实用方法论,也深化了对基本面因子时效性与预测技术的认知,具备较高的理论和实务参考价值。[page::0,4-14]
---
重要图表参考
朝阳永续一致预期 ROE覆盖度,显示数据源覆盖有限,影响因子广泛应用。
预测当期ROE较传统指标表现更优的累计因子溢价曲线。
多种ROE预测方法的因子溢价累积净值图,展示波动率加权联合预测领先性。
不同行业ROE波动率极端数占比与波动率权重偏离均值,突出周期性行业波动显著。
传媒行业商誉占比与ROE波动权重相关系数,体现特殊行业波动来源。
使用基本面思维改进ROE选股效果的逻辑链条,清晰展示方法论框架。
---
综上,该研究为基于基本面的ROE因子预测施以创新的时效提升方案,方法科学、数据扎实,既有理论深度也具实务指导意义,值得投资量化研究者深入学习和应用。[page::0-14]