量化视角衡量个股估值提升的确定性——估值提升概率模型及其有效性分析
创建于 更新于
摘要
本报告提出基于估值提升概率模型的新型量化估值因子,利用kendall相关系数和概率函数刻画因子与估值的关系,计算股票未来估值排序的提升期望,从而选取未来估值提升确定性最高的股票。实证结果显示该因子在市值前1/3样本效果显著,月均IC最高达0.053,年化多空收益差优于传统PB因子,空头收益稳定性较高,策略有效性受市场估值逻辑变化影响明显 [page::0][page::4][page::8][page::14][page::16][page::18][page::20]
速读内容
股价涨跌主要由估值与基本面变动构成 [page::0]
- 股价涨跌可拆分成估值变动和基本面变动两部分,短期股价波动多由估值变动驱动。
- 基本面信息发布频率较低,估值变动逻辑持续时间较因子IC更长。
估值提升概率模型构建 [page::8][page::9][page::10]
- 通过kendall秩相关系数量化因子与估值排序的关系,定义概率函数 φ(d) 表示因子差异d时估值排序大小的概率。
- 模型输入因子转换为分位数,估计股票两两估值相对大小概率,计算每只股票估值排序的期望 E(R)。
- 估值提升期望定义为股票未来估值排序期望减当前估值排序分位数(PB的分位),期望越大代表上涨空间与alpha越大。
- 采用线性概率函数 φ(d)=min(0.5+νd,1) 并给出参数ν的最大似然估计,与kendall相关系数τ相关。
估值提升因子计算流程及模型延伸 [page::11][page::12][page::13]
- 因子转换分位 -> 估值排序期望计算 -> 估值提升幅度计算 -> 迭代替换因子。
- 概率函数可用logit替代线性函数进行拟合,虽需数值解但拟合灵活。
- 支持离散事件因子建模及统计显著性检验,体系具有扩展性。
实证检验及因子表现——lift曲线与因子IC对比 [page::14][page::15][page::16]


| 因子 | 全市场月均 IC | 全市场年化 IR | 市值前1/3月均 IC | 市值前1/3年化 IR |
|-------------|---------------|---------------|-----------------|------------------|
| PB | 0.05 | 1.54 | 0.037 | 0.793 |
| ROE | -0.006 | -0.187 | 0.024 | 0.753 |
| PB|ROE新因子| 0.047 | 1.618 | 0.044 | 1.304 |
| PB|ROE|delta_P|gpr复合因子 | 0.051 | 1.753 | 0.053 | 3.255 |
- lift曲线显示净资产与扣非ROE因子在预测高估值样本中表现突出,特别是大市值样本。
- ROE因子对低市值和负收益样本效果较差,净资产分层比市值分层更合理。
- 新因子相较简单PB因子市值前1/3样本月均IC及IR均显著提升。
多空收益差与多头超额收益稳定性分析 [page::18][page::19]


- 新估值提升因子年化多空收益差提升至16.45%,远超简单PB因子10.81%。
- 多头贡献与空头贡献超额收益相当,但空头稳定性更好。
- 2017年多头相对基准回撤主要因估值逻辑变化及PB因子未均值回归,估值提升因子对市场变化敏感。
- 估值逻辑变化会导致排序期望预测有偏差,对因子两端股票影响最大。
结论与投资启示 [page::20]
- 将估值提升概率作为选股因子,更好地融合了基本面与估值因子信息。
- 基于概率模型的估值排序期望比简单因子IC更稳定,尤其在大市值样本作用显著。
- 因子风险点主要是估值逻辑变化及策略对市场风格依赖。
- 建议选股时结合行业分组,动态估计概率函数参数,且关注因子的多头稳定性以完善组合管理。
深度阅读
金融工程深度报告——《量化视角衡量个股估值提升的确定性——估值提升概率模型及其有效性分析》详尽解析
---
一、元数据与报告概览
- 报告标题:《量化视角衡量个股估值提升的确定性——估值提升概率模型及其有效性分析》
- 作者及联系方式:
- 丁鲁明(中信建投证券研究发展部首席分析师)
- 陈元骅(金融工程分析师)
- 发布机构:中信建投证券研究发展部
- 发布日期:2019年3月21日
- 主题:探讨估值因子在量化投资中的核心作用,提出基于概率模型的估值提升幅度评估方法,并实证其有效性。
- 报告核心观点:
- 股价涨跌可分为估值变动和基本面变动,估值部分贡献较大且波动更频繁。
- 传统因子(如ROE)短期有效性有限,因其缺乏对估值的直接解释。
- 建立基于Kendall相关系数的概率模型,估计股票未来估值提升的概率及幅度,预测因子alpha。
- 新因子(基于估值提升概率模型)在市值较大的股票样本中表现优异,能显著提升投资组合的超额收益。
---
二、逐节深度解读
1. 引言及研究动机
- 关键论点:
- 量化投资和主动基本面投资看似差异很大,但本质都是依赖股票估值。
- 量化利用IC和IR评价因子表现,但IC忽视估值信息,导致因子效果短暂。
- 主动投资对个别股票更深入估值分析,但难以覆盖全市场。
- 报告旨在融合两者优点,提出通过基本面因子预测估值概率分布,挖掘估值提升空间,提升alpha。
- 推理依据:
- 量化多因子模型直接使用数据驱动因子评分,主动投资则偏重未来盈利预测的估值模型。
- 估值因子作为连接基本面与市场情绪的纽带,是股票多头决策的核心。
2. 估值因子的理论基础及现有策略(第二章)
- 估值因子的纽带作用(2.1节)
- 图1展示估值因子连接
基本面(长期、低频)与情绪面(短期、中高频)
,表明估值是多维因素共同作用的结果。- 以PE为例,股价涨跌分解成估值变动(PE变化)和基本面变动(盈利变化)两部分,基本面更新频率低,因此估值变动在短期股价波动中占主导。
- 常用估值思想(2.2节)
- 详细阐述绝对估值(基于现金流折现等) vs 相对估值(基于行业相似公司估值的拟合,类似KNN方法)。
- 报告创新点在于借鉴相对估值思想,采用统计学习方法对估值进行建模。
- 估值因子相关量化策略回顾(2.3节)
- 多因子模型中估值因子通常用市值分层(图2显示,估值多空收益差稳定,有利alpha)。
- 结合风险因子模型做因子加权和中性化,提升组合稳定性。
- 估值解释模型(例如PB-ROE模型)剔除低基本面股票中“假低估”情况,提升因子筛选精准度。
- 因子择时模型用估值差异筛选更优因子,提高多因子策略效果。
- 信息与概率视角(2.4节)
- 标准量化因子模型隐含估值因子均值回归假设,低估值股票未来升值概率更大。
- 引入未来估值排序的概率分布建模思想,引导后续概率模型构建。
- 估值排序模型启发:足球彩票思想(2.5节)
- 类比足球比赛积分排序,有两个思路预测排名:
1. 环绕整体实力评分的绝对值排序(类似绝对估值法)
2. 利用比赛胜负概率模型估算排名期望,寻找隐含套利机会
- 股市估值排序同理:估算相对估值大小的概率,计算未来估值期望排序,挖掘大概率套利。
3. 估值提升概率模型的建立与参数估计(第三章)
- 统计规律与Kendall相关系数(3.1-3.3节)
- 传统IC表现短暂,因子与估值相关系数更稳定 (公式:$\mathcal{IC}{BP} = corr(fi, BPi)$)。
- 相关系数为0,说明因子无估值解释力;为1则因子无增量信息;0到1之间则可挖掘不符合估值排序逻辑的套利机会。
- 利用Kendall秩相关系数定义,“股票对”是否排序一致概率作为核心测度。
- 建立概率函数 $\varphi(d)$(3.4节)
- 假设股票估值相对大小概率只依赖因子(如ROE)排序值差 $d$。
- 线性概率函数模型:$\varphi(d) = \min(0.5 + \nu d, 1)$,其中 $\nu > 0$ 表示估值大小概率随因子排序差距加大的速率。
- 估值排序期望 $E(Rk)$ 计算为包含概率函数在内的两部分求和。
- 标准差(方差)亦据此推导,明确排序不确定性的度量。
- 概率函数参数估计(3.6节)
- 利用最大似然估计法估算参数 $\nu$,结合样本内Kendall $\tau$ 值,通过显式公式解算 parameter。
- 图3显示不同$\nu$值对应概率函数的斜率和截断情况。
- 强调股票对之间排序不是完全独立的,采用近似独立性和加权估计简化计算。
- 模型计算流程总结(图4)
1. 将因子ROE转为分位数序数。
2. 在历史样本估计概率函数.
3. 计算估值排序期望$E(Rk)$。
4. 计算估值提升空间$E(\Delta dk) = \frac{E(Rk)}{n} - q(PBk)$。
5. 进一步迭代替换因子,构造更复杂组合。
- 模型进一步拓展(3.7节)
- 统计显著性检验方法介绍。
- 对离散型因子概率函数的讨论。
- 建议使用其他连续函数(如Logit函数,图5展示)对概率模型进行拟合。
4. 模型应用与实证检验(第四章)
- 数据处理(4.1节)
- 数据来源:2008-2018年A股全部股票价格及基本面。
- 数据清洗:剔除停牌、涨停股票;异常因子值行业中性化处理;负PB值股票剔除。
- 以扣非ROE三年平均为示例因子。
- Lift曲线验证(4.2节-4.3节)
- 介绍Lift曲线作为因子预测力度检验工具,衡量因子极值子集内高估值股票比例。
- 图6与图7显示,ROE与净资产因子较市值对高估值股票的预测能力明显更强,特别是在市值前1/3样本中,去除了小市值公司带来的噪声干扰后,ROE作用显著提升。
- 表1显示在行业维度ROE与估值的相关系数差异明显,如银行、医药、家电、食品饮料相关度高,暗示行业划分估值提升概率模型的必要性。
- 以行业为单位分别估计参数,做到行业中性化,提升模型泛化能力。
- 因子表现比较(4.4节)
- 表2与表3披露PB、ROE、估值提升因子(PB|ROE)、以及多因子等权的IC和IR表现。
- 新估值提升因子在全市场表现有限(主要因ROE在全市场单调性差),但在市值前1/3样本表现显著,IC和IR均有明显提升。
- 复合估值提升因子包括ROE、净利润增速、毛利率,IC提升至0.053,IR达3.255,优于单一PB因子。
- 指出因子构造相较于简单等权更优,因为基于对估值逻辑的稳定认知,因子估计受未来变化扰动较小。
- 收益表现(4.5 - 4.6节)
- 估值提升因子年化多空收益差提升明显,从10.81%上升到16.45%。
- 不过因子收益表现波动较大,如2013、2014、2018年因ROE有效性下降,导致估值提升因子表现回撤。
- 估值提升因子兼具PB因子均值回归优势和ROE因子对基本面解释力,组合多头选入高ROE股票,空头选入低ROE股票,两者贡献相当但空头更稳定。
- 图9显示收益差变化趋势,图10拆分多头与空头贡献,强调多头受市场估值逻辑变动影响较大。
- 理论推导(第20页)刻画参数偏差对期望估值排序的影响,尾部效应最敏感。
5. 总结(第五章)
- 股价变动中估值变化起主导作用,建立估值提升概率模型通过基本面因子的相关性与估值排序,推断未来估值的概率分布与排序期望,进而预测股票alpha。
- 实证显示,估值提升因子显著提升了普通估值因子的稳定性和预测能力,尤其在大市值股票样本中,提升效果突出。
- 估值提升因子是复合因子,通过细分行业、加入多因子解释显著提高模型表现。
- 投资策略需注意估值逻辑变动风险和因子均值回归失败带来的潜在回撤。
- 新因子提升了因子有效期和多头选股的稳定性,为量化选股体系的核心组成部分提供了有力支撑。
---
三、图表深度解读
1. 市场表现(图0)
- 展示期间为2016年6月至2017年5月的上证指数与国债指数表现,上证指数波动明显高于国债指数,最高涨幅接近14%,反映股市较强波动性与投资机会。
2. 估值因子市值分层表现(图2)
- 右轴为PB和PE多空收益差,左轴为多空组合收益。
- PB和PE多空组合收益稳定增长,PB收益率远超PE,显示PB因子更强的选股能力。
- 市值分层法多空收益差稳定性支持该因子构建股票多空组合的有效性。
3. 线性概率函数(图3)
- 两条线分别代表不同参数$\nu$的线性概率函数,随因子分位数差$d$增加,预测高估股票概率升高。
- 反映股票基本面差异越大,估值排序概率越显著。
4. Lift曲线(图6和图7)
- 横轴为因子排名,纵轴分别为估值处前20%的股票数量及比例。
- ROE和净资产因子lift明显高出基准线,说明其对估值排序的解释力强。
- 市值样本拉入后,ROE在高市值样本中解释力提升,更符合投资实践需求。
5. 因子与估值在不同行业相关性(表1)
- 数据表明ROE在部分行业相关度高达0.4至0.5(银行、家电、食品饮料等),而在某些行业(综合、房地产)相关度为负,说明估值逻辑行业差异大。
- 净资产负相关一致,显示估值对资产规模有普遍影响。
6. 因子IC对比(表2&3)
- 新估值提升因子全市场月均IC约0.047,和传统PB因子相近。
- 市值前1/3样本中,新因子IC及IR显著提升,表现更稳定及强于传统单因子。
- 多因子组合展示更优IC稳定性。
7. 行业净资产与ROE中位数(图8)
- 不同行业净资产和ROE分布不均,反映行业基本面结构差异。
- 例如食品饮料净资产较大且ROE居中,医药行业ROE和净资产波动也较显著,支持分行业模型估计。
8. 多空收益差(图9)
- 估值提升因子多空收益差明显高于单纯PB因子,提升投资组合alpha。
- 不同市值和中性化方法对收益差表现影响明显。
9. 多头与空头相对基准超额收益(图10)
- 多头和空头贡献超额收益均衡,但空头部分收益更稳定。
- 2017年及2018年多头收益出现较大波动,验证估值逻辑变化对因子收益的影响。
---
四、估值分析
- 报告采用了概率函数构建估值排序模型,特别用Kendall秩相关系数定义概率,即两个股票之间估值排序一致的概率为基础,通过最大似然估计确定概率函数参数,计算股票未来估值排序的期望。
- 估值提升幅度计算为未来估值期望与当前估值排序的差值,直接关联股票未来alpha空间。
- 模型中概率函数取形式为线性函数及logit函数,前者有解析解,简单明了,便于快速估计和策略实施。
- 估值提升因子实现对传统PB因子的优化,融合基本面ROE及其它因子,构建复合多因子,其有效性高于传统简单因子。
---
五、风险因素评估
- 估值逻辑变化风险:因子有效期受市场估值逻辑变化影响,估值相关系数波动带来模型预测偏差,导致投资回撤,如报告中2017年多头收益回撤充分证明。
- 因子单调性与稳定性风险:ROE等基本面因子全市场单调性不佳,特别负ROE股票过多,影响估值排序可靠性和模型稳健性。
- 概率函数假设简化风险:模型假设概率函数只依赖因子间差距,忽视其他潜在影响因素,可能导致低估模型复杂性。
- 估值数据和因子数据质量风险:基本面数据频率低,行业分割不精细,估值数据有缺失,用行业中位数填充可能引入偏差。
- 行业间差异风险:因子在不同行业效力显著不同,不合理处理行业异质性可能导致误判。
作者通过行业分层和中性化处理努力缓解以上风险,并建议动态更新参数,进行显著性检验,提升模型稳定性。
---
六、批判性视角与细微差别
- 报告强调估值提升因子在市值较大公司中表现较好,暗示小盘股方法适用性有限。
- 对ROE因子在全市场有效性不足的批点评述恰当,未盲目推广所有因子。
- 模型对股票对间独立性的假设是简化,潜在的估值排序传递关系可能破坏独立性,影响参数估计精度。
- 估值因子归纳了市场定价的稳定逻辑,但股价波动频繁,短期预测的准确度和有效期仍需谨慎对待。
- 复合因子构建方案避免单因子过拟合,但数据截面扩展将增加噪声,需要平衡复杂度。
- 估值提升概率模型的新颖性突出,但较少详述如何结合频繁行情波动与特定事件驱动影响。
---
七、结论性综合
本报告系统而深入地探讨了基于估值提升概率模型的股票估值排序预测及其选股有效性,充分体现了量化方法与基本面分析的融合。核心创新是利用Kendall相关系数拆分基于因子的估值排序概率,通过估算未来估值排序期望推算股票预期alpha空间,提升了估值因子的解释力和稳定性。
实证结果表明:
- 估值提升因子在大市值股票中表现优于传统PB因子,IC、IR及年化收益均实现显著提升。
- 因子多头和空头均贡献稳定超额收益,复合因子兼顾了均值回归和基本面成长的特性。
- 行业内定制概率模型有效缓解异质性,提高因子表现的稳健性。
- 模型已在A股2008-2018年数据验证,具备良好现实应用价值。
报告深入解读了传统因子模型的不足,提出并验证了新的估值统计建模方法,兼顾统计学严谨和实际可用性,极具创新意义。未来可在模型动态更新、非线性函数拟合及因子多维扩展方向进一步完善。
---
参考溯源
- 报告主要结论与方法论来源:[page::0, 1, 3-10]
- 估值因子理论与策略回顾:[page::4-7]
- 建模流程及概率函数参数估计详述:[page::9-13]
- 实证分析数据及Lift曲线解读:[page::13-15]
- 行业相关性及因子表现分析:[page::15-17]
- IC和收益实证结果及风险讨论:[page::16-20]
- 总结及风险点评估:[page::20]
- 分析师介绍与评级说明:[page::21-22]
---
附图展示示例
图1:估值因子连接基本面与市场情绪

图3:线性概率函数示意

图6:Lift曲线

表1:因子与估值相关性(行业内)
见上述解析页 [page::16]
---
本报告的深度量化框架和详实实证为投资者理解和把握股票估值提升提供了清晰路径和有效工具,推动了量化与基本面研究的实践融合。