分析师预期数据在构建因子中的应用
创建于 更新于
摘要
本报告系统研究了分析师预期数据在量化基本面因子构建中的应用,涵盖覆盖度因子、预期EP因子、超预期因子、预期增长因子、评级因子和目标价因子,展示各因子构建方法及回测表现,发现通过“代替”、“比较”和“时间维度对比”方式构建的因子均具备一定的选股能力,特别是结合分析师一致预期净利润的预期EP因子和超预期因子表现优于传统财报因子,且中性风格和行业后依然稳定,提升了因子信息的时效性和有效性 [page::1][page::5][page::11][page::13][page::27]。
速读内容
研究背景与数据介绍 [page::1][page::5]
- 分析师预期数据补充传统财报数据的信息滞后缺陷,包含盈利预期明细和评级数据两大类。
- 盈利预期明细数据覆盖沪深300、中证800股票较好,覆盖度稳健超过60%。
- 评级数据包含投资建议和目标价,反映分析师对价格市场预期的直接反映。
覆盖度因子构建与表现 [page::8][page::10]

- 覆盖度因子基于分析师对个股的覆盖频次构建,反映市场关注度。
- 中性前无显著收益,2017年后覆盖度因子收益率有所提升。
- 中性后覆盖度因子多空收益稳定提升,具备一定收益区分能力。
预期EP因子——代替法构建 [page::11][page::12]

- 用分析师一致预期净利润代替传统财报净利润,构建预期EP因子。
- 回测显示预期EP因子比原EP因子选股能力显著提升。
- 中性后表现稳定且仍保留较多选股信息。
超预期因子——比较法构建 [page::13][page::14][page::15][page::16]

- 以分析师预测EPS与已实现线性外推或同比外推EPS对比构建超预期因子。
- 因子整体稳定且具备较好选股能力,多空收益良好,特别是近2个月因子表现优异。
- 中性后仍保持超额收益,因子流动性及稳定性提升。
预期增长因子——时间序列比较法构建 [page::17][page::18][page::19][page::20]

- 主要利用不同时间点一致预期EPS的变化率构建,反映预期盈利成长。
- 全市场、多指数中长期稳定获超额收益。
- 中性后相关性弱,风格影响小。
评级因子及目标价因子构建与表现 [page::22][page::23][page::25][page::26]

- 评级因子基于分析师评分(五档制)构建,表现较弱,主要体现在空头端区分能力较强。
- 目标价因子由最高目标价与现价差异构建,选股能力有限,且空头分组表现更好。
- 中性后两因子稳定性提升但收益率下降,近年表现偏弱。
因子风险指标及总结 [page::9][page::27]
- 多数因子在不同回测区间均表现出一定的选股能力,预期增长与超预期因子效果较好。
- 分析师预期数据可利用“代替”、“比较”和“时间维度比较”多种方法构建因子。
- 通过中性处理去除风格和行业偏差,提高因子稳定性和有效性。
- 分析师预期数据有效弥补了财报数据更新滞后的弊端,提升因子alpha获取能力。
深度阅读
报告分析——《分析师预期数据在构建因子中的应用》
---
一、元数据与概览
报告标题:《分析师预期数据在构建因子中的应用》
研究机构:长江证券研究所
报告日期:2020年12月18日
主题类别:金融工程专题报告
作者与联系人:
- 谭桃(执业证书编号:S0490513030001)
- 郑起(执业证书编号:S0490520060001)
核心观点:
报告系统且详尽地探讨了分析师预期数据(盈利预期明细数据和分析师评级数据)在量化投资中构建选股因子的应用方法及效果,特别是在覆盖度因子、预期EP因子、超预期因子、预期增长因子、评级因子以及目标价因子六大类因子构建及其绩效表现上的研究。研究重点体现了分析师预期数据相较于传统财务报表数据在时效性、市场预期表达、以及因子收益稳定性方面的优势,明确表明利用分析师预期数据能够改善传统因子模型的信息滞后性,提高alpha收益能力。[page::1, 5]
---
二、逐节深度解读
2.1 报告要点概述
- 分析师预期数据背景:基于卖方分析师对上市公司未来财务数据的预测,这些数据能够实时反映公司经营预期,解决了财报数据滞后和低频率的问题。当前主要为盈利预期明细数据及分析师评级数据两大类。
- 应用方式:
1. 利用覆盖度:报告数量反映市场对个股的关注度,可构建覆盖度因子,具备一定选股能力,尤其在做空端表现稳定。
2. “代替”法构建因子:将分析师预期数据代替最新财报数据,构建预期EP因子,性能优于传统EP。
3. “比较”法构建因子:比较分析师预期与实际财务数据的差距,构建超预期因子,有稳定的选股能力。
4. 时间维度比较:观察分析师盈利预期在时间序列上的变化,构建预期增长因子,选股能力稳定且相关性低于传统风格因子。
5. 量化投资建议:将分析师评级量化,构建评级因子和目标价因子,主要用于做空端,中性和行业中性后表现提升。
- 风险提示:模型存在失效风险,数据均基于历史回测,不保证未来收益。[page::1]
---
2.2 数据介绍与因子构建基础
- 盈利预期明细数据结构:包括EPS(每股收益)、净利润、EBIT、EBITDA、主营业务收入等多项财务指标,每条数据由股票代码、预测报告期、预测日期、券商和分析师标识。[page::6]
- 数据覆盖度:分析师对沪深300股票覆盖比例稳定超过80%,中证800和中证500次之,全市场约40%-60%,为因子构建提供数据基础和可行性。图1清晰展示了不同指数成分股分析师覆盖率的动态变化趋势,反映数据稳定性和广泛性。[page::6]
- 分析师评级数据结构:包含评级等级(买入、增持、中性、减持、卖出)、最高目标价、最低目标价,以及变动方向等,用于量化市场对股票的投资建议。其覆盖度同样较高,与盈利预期明细数据覆盖度相似。图2体现了评级数据覆盖度时间演变。表2列出了其字段结构。[page::7]
---
2.3 覆盖度因子分析
- 构建逻辑:利用分析师对股票报告的累计数量作为单纯的“市场关注度”指标,体现热度及可能带来的信息溢价。计算回滚不同时间段(2-5个月)内覆盖报告总数。
- 中性前表现:因子回测表现平平,未能持续跑赢基准,尤其在2017年之前。2017年后多头和多空收益出现明显改善,但整体选股能力有限。图3(全市场)和图4(中证800)直观呈现净值增长变化。[page::8]
- 风险指标详解(表3):信息系数IC较低(约1%-1.4%),超额收益大多为负,ICIR(信息比率)极低,显示因子未能稳定识别未来收益。
- 中性调整的重要性:因覆盖度高的股票常具备较强龙头属性,因子表现受市场风格影响较大。因子与规模、盈利和动量等风格因子显著正相关(表4)。
- 中性后表现改进:去除风格和行业影响后,因子表现稳定性和多空收益均有所提升(图5和图6)。收益区分能力虽有限,但多空端表现较中性前更优(表5)。[page::9, 10]
---
2.4 盈利预期明细数据因子应用
预期EP因子
- 构建方法:用分析师一致预期净利润替代公司最新财务数据计算EP。数据处理时选取预测数据最多的报告,并对没有净利润但有EPS数据的进行换算。
- 中性前表现:2019年前该因子有稳定的超额收益和多空收益能力,2019年后大幅回撤(图7与图8)。
- 相较传统EP因子优势:预期EP因子IC高于原EP因子,且回撤程度较小(表6)。
- 相关性及中性后表现:该因子与原EP因子相关性较高(80%以上),但信息保留度更好;和价值、盈利因子正相关明显(表7)。中性后因子表现提升,亏损减小,多空收益率稳定(图9、图10与表8)。[page::11, 12]
超预期因子
- 构建理念:比较分析师预期EPS与季报预估EPS的差异,反映上市公司业绩相对于市场预期的表现。采用两种EPS外推方法比较“以现在比较过去”的预期差异。
- 中性前表现:历史超额收益稳定,多空收益良好(图11、12)。表9显示因子在多数年份实现正向超额收益,多头及多空夏普比表现稳健。
- 因子表现属性:不同外推方法和时间窗口均表现出色,2个月回滚有最佳效果(表10)。
- 风格相关性:整体与风格因子相关性低,且与价值因子负相关(即高估股更易业绩超预期),与规模、盈利和成长因子有负相关(表11)。
- 中性后稳定性:中性后依旧保持较强选股能力及收益稳定性(图13、14,表12、13)。[page::13-16]
预期增长因子
- 构建方法:仅依据分析师预期数据的时间序列同一指标变化率(如EPS当前预期与过去预期的比率)计算,反映市场对未来盈利增速的预期变化。
- 中性前表现:表现稳定且线性好,多头收益尤为显著(图15、16,表14)。
- 参数选择:以4个月时间加权的因子表现最佳,总体收益稳定。
- 中性后表现:与传统风格因子相关性低,移除风格和行业影响对因子表现影响有限(表16)。中性后因子依然表现出一定的选股价值及风险调整收益(图17、18,表17、18)。[page::17-21]
---
2.5 分析师评级数据应用
评级因子
- 构建理念:将分析师评级标准化量化(买入5分至卖出1分),计算股票评级均值构建因子。
- 中性前表现:整体区分能力弱,空头端表现相对更好,近年全市场表现一般,中证800较好(图19、20,表19)。
- 中性后关联性:与规模、动量、盈利和成长因子相关性较强,提示评级高的股票多为龙头股(表20)。
- 中性后表现:因子稳定性提升,但个股区分力依然集中于空头端,多空收益虽有所恢复仍较弱(图21、22,表21)。[page::22-24]
目标价因子
- 构建理念:基于分析师最高目标价相对现价差异计算,反映分析师对个股收益预期。
- 中性前表现:选股能力有限,空头端区分力较好,部分周期具有多头收益(图23、24,表22)。
- 中性后关联性:目标价因子与反转因子负相关明显,说明目标价涨幅大的股票可能近期表现较弱(表23)。
- 中性后表现:因子稳定性提升,但收益能力整体下降,2015年后表现基本乏力(图25、26,表24)。[page::24-26]
---
三、图表深度解读
- 图1 & 图2: 展示分析师盈利预期明细数据与评级数据覆盖度,沪深300覆盖率最高(稳定在80%以上),中证800和中证500次之,整体数据覆盖范围广,支持相关因子构建。
- 图3 & 图4: 中性前覆盖度因子净值回测,表现一般,无持续超额收益,2017年后表现有所改善。
- 图5 & 图6: 中性后覆盖度因子表现,去除风格行业影响后稳定多空收益增强。
- 图7 & 图8: 中性前预期EP因子回测,2019年前表现良好,之后回撤。
- 图9 & 图10: 中性后预期EP因子表现改善,收益波动减少。
- 图11 & 图12: 同比外推超预期因子中性前全市场及中证800回测,收益稳定表现较好。
- 图13 & 图14,图17 & 图18,图21 & 图22,图25 & 图26 均为各因子不同条件下的表现,反复证实整体因子在中性后稳定性较优,且多空端收益有所改善(题材覆盖、成长预期等)。
- 表格多次展现风险指标指标(如IC、ICIR、多空收益及夏普比),展现因子回测的统计显著性与风险调整表现,是验证因子有效性和稳定性的重要数据基础。
---
四、估值分析
报告未直接涉及传统的定价模型(如DCF、市盈率倍数等)估值计算,焦点在于选股因子构建及收益预测。因子构建结合分析师盈利预期和评级数据,实质上基于对未来盈利和市场预期的量化预测,为量化投资提供信息增量。
——
五、风险因素评估
- 模型失效风险:因子基于历史数据,未来表现不确定。
- 数据覆盖及质量:部分股票或时期覆盖不足,可能影响因子效果。
- 市场风格变迁影响:部分因子表现受市场风格偏好显著影响,需风格中性处理以提纯信号。
- 投资评级及目标价信息滞后/失真风险:评级政策、分析师行为变动可能影响预期数据的代表性。
风险说明中明确指出历史表现无法保证未来收益,投资者谨慎参考。[page::1, 26]
---
六、批判性视角与细微差别
- 因子表现时间变化明显:许多因子2017及2019年后出现回撤或表现波动,需关注市场结构和数据变化对因子有效性的影响。
- 信息比低的问题:覆盖度因子IC虽稳定但信息比率极低,说明预测能力弱。
- 评级与目标价因子表现偏弱且集中于空头端,这可能源于评级系统惯性问题或分析师评级保守,提示该类因子适合作为空头对冲工具而非多头收益核心。
- 强相关的风格因子:覆盖度因子与规模、盈利等风格因子强相关,表明纯净因子信号受限,需要中性化处理但仍难完全剥离风格影响。
- 数据依赖性与时效性:部分因子表现受回滚时间参数影响,参数选择需综合历史表现与交易成本考量。
---
七、结论性综合
本报告系统地阐述了分析师预期数据(包括盈利预期明细和评级数据)在量化选股因子中的应用价值与实证表现。分析认为:
- 数据优势:分析师预期数据弥补了传统财报数据时效性差的缺陷,能够快速反映市场对公司未来盈利的预期,提升因子信息含量。
2. 因子构建全貌:
- 覆盖度因子:通过分析师报告数量衡量市场关注度,具有风格依赖性且中性后表现改善,空头端区分力较强。
- 预期EP因子:用分析师预期净利润替代财报,信息量增加且选股能力明显优于传统EP,建议使用短期(2个月)回滚。
- 超预期因子:结合实际季报和预测EPS差异,较好捕捉业绩超预期带来的股价反应,超额收益稳定且中性后更佳。
- 预期增长因子:纯粹基于分析师预期EPS时间序列的增长率,相关性低、选股能力稳定,是因子组合中的重要补充。
- 评级因子和目标价因子:直接量化分析师投资建议,选股能力有限且主要集中在做空端,但中性后表现稳定性提升。
- 因子效能与稳定性:总体来看,基于分析师预期数据构建的因子优于传统财报因子,在中性风格和行业板块后显示出较强稳定的风险调整表现。不同构建参数对因子表现有显著影响,短期(2~4个月)回滚周期因子表现更佳。
4. 建议与风险:研究建议结合行业和风格中性方法使用这些因子,同时需关注分析师覆盖范围及数据质量问题。模型历史有效不代表未来表现,风险在于模型失效和市场环境变化。
该报告为量化策略构建提供了系统的实证分析基础,对投资研究人员深化分析师预期数据的应用、完善选股因子体系具有重要参考价值。[page::1-27]
---
附:关键图表示例
- 图1 盈利预期明细数据覆盖度

- 图3 全市场覆盖度因子(4个月)回测净值

- 图7 全市场预期 EP 因子(2 个月)回测净值

- 图11 全市场同比外推超预期因子(2个月)回测净值

- 图15 全市场预期增长因子(4个月时间加权)回测净值

- 图19 全市场评级因子(2个月)回测净值

- 图23 全市场目标价因子(2个月)回测净值

---
综上,报告结构严谨,数据丰富,统计指标全面显示了分析师预期数据构建因子的详细应用路径及其各自的优劣,揭示了预期数据在量化基本面分析中的重要价值,提示投资者在实际应用中需进行合理的风格、行业中性调整,并结合多种信息源以优化投资策略效果。[page::1-27]