`

量化视角衡量个股估值提升的确定性——估值提升概率模型及其有效性分析

创建于 更新于

摘要

本报告基于概率模型构建股票估值提升幅度的预期量化因子,揭示因子与估值的kendall相关系数的统计规律,通过对全市场及大市值样本实证,发现该估值提升因子在市值排名前1/3样本中表现优异,显著提升IC和多空收益差,且能更稳定地捕捉股票未来上涨空间,为量化选股提供新的估值视角和策略方向 [page::0][page::2][page::5][page::6][page::11][page::12][page::14]。

速读内容

  • 股价涨跌幅主要由估值变动和基本面变动组成,基本面数据更新频率低,估值变动对短期股价影响更大。因此估值因子能连接基本面与市场情绪,成为投资决策中的关键纽带 [page::0][page::2]。

  • 通过建立概率函数描述在两只股票基本面因子差异时估值相对大小的概率,结合kendall相关系数对因子与估值关系进行拆解,从全样本股票两两比较的概率视角构建估值提升期望指标 [page::5][page::6][page::7]。

- 概率函数常用线性形式实现,并依据kendall相关系数估计参数ν,逻辑联系如下图因子计算流程:
  • 实证采用2008-2018年A股数据,剔除停牌、涨停及PB负值股票,行业中性化后估值提升概率因子有效性更佳,尤其在市值排名前1/3的样本中因子表现突出 [page::9][page::10][page::11]。

  • 估值提升因子的月均IC相较于基础PB因子提升从0.038至0.053,信息比率(IR)从1.08提升到3.255,年化多空收益差提升从10.81%至16.45% [page::11][page::12]。

- 估值提升因子有效性依赖于行业及市值层面分组,结合净利润增速和毛利率因子后因子稳定性和收益表现显著增加 [page::11][page::12]。
  • 多空收益差拆解显示估值提升因子多头和空头对收益贡献相当,但空头的收益更为稳定,多头组合回撤主要源于估值因子均值回归失效和估值逻辑变化的风险 [page::13][page::14]。



深度阅读

《量化视角衡量个股估值提升的确定性——估值提升概率模型及其有效性分析》深度解析



---

1. 元数据与报告概览


  • 报告名称:《量化视角衡量个股估值提升的确定性——估值提升概率模型及其有效性分析》

- 发布时间:2019年3月21日
  • 发布机构:中信建投证券股份有限公司

- 研究团队:丁鲁明、陈元骅(丁鲁明金融工程研究团队,执业证书编号S1440515020001及S1440518090004)
  • 核心主题:通过构建基于估值的概率模型,量化衡量及预测个股未来估值提升的幅度,进而指导选股和构建投资组合,实现alpha收益的提升。

- 主要观点摘要
- 股价变化可分解为估值变动与基本面变动,估值变动是股价短期波动的重要驱动。
- 估值逻辑的有效期通常长于单因子(如ROE等)对股价涨跌的影响时间窗口。
- 通过kendall相关系数构建股票估值排序的概率模型,计算个股未来估值提升的预期幅度。
- 估值提升幅度预期越大的个股,未来上涨空间越大,具备更高的alpha潜力。
- 新构建的估值提升因子在市值前1/3的样本里表现尤为突出,年化多空收益率提升明显。

本报告旨在从量化视角深度剖析估值因子背后的理论逻辑、概率模型构建及其实证效果,强调估值提升概率的确定性及其在多因子选股体系中的重要作用。[page::0] [page::1] [page::17]

---

2. 逐节深度解读



2.1 引言与报告架构



报告起初讨论了量化投资与主动基本面投资的区别与共性:
  • 量化投资强调自下而上的统计检验和因子构建,因子组合决定投资权重。

- 主动投资强调自上而下基于宏观或行业视角对基本面深入研究并估值。
  • 两者均依赖估值,但量化侧重公开数据的统计建模,主动投资注重公司特有数据与未来利润逻辑。

- 估值因子在多因子模型中充当桥梁,对未来股价走势起价差预测作用。

强调估值因子的纽带作用,股价涨跌可拆分为估值与基本面双重影响,有助于理解市场短期估值择时行为和长期基本面驱动的投资逻辑。[page::1]

2.2 重新理解估值因子



纽带作用



图1展示了估值因子处于基本面和情绪面的中枢地位,基本面包括盈利能力、成长性、资本结构等低频数据;情绪面包括短期股价涨跌、成交量、买卖盘强弱和分析师评级等高频信息。估值因子连接这两端因素,是模型构建的核心。

数据方程展示了以PE为例股价涨跌变化可拆分为估值变化(PE变化)和基本面变化(盈利E变化),其中基本面中长期稳定,估值在短期频繁波动,解释了市场策略换手率高于基本面更新频率时,投资需做好估值概率分布的合理估算。[page::2]

估值思想回顾


  • 绝对估值法:基于自身现金流预测折现,不考虑市场和可比公司信息。

- 相对估值法:基于市场现有均衡状态,通过拟合普遍定价规律(例如KNN通过行业、市值、财务指标等多因子空间距离类比)来预测估值。

报告愿景借鉴相对估值思想构建统计学习模型,并在概率框架中量化估值排序概率与提升空间。[page::2][page::3]

2.3 估值因子在量化策略中的应用



细分为:
  • 因子模型:通过市值分层(等分20组)选取估值最低20%和最高20%构造多空组合,长周期表现稳健,最大回撤小但A股做空受限。结合风险因子模型进行指数增强,含行业和市值风险中性化,回归残差作为净化后因子。

- 估值解释模型:如PB-ROE线性回归剔除ROE解释部分,以避免只选出基本面差的低估值股票;次新股择时模型参考同业市值组估值中位数。
  • 因子择时:利用估值筛选因子集合中的有效因子,多头组合中进一步筛选估值较优的50%可提升alpha显著。


图2显示市值分层后PE、PB因子多空组合收益和收益差,长期稳健增长,支持估值因子的选股效力。[page::3][page::4]

2.4 估值因子的概率视角及足球彩票策略类比



经典量化单因子IC可能出现趋势性失效,尤其因子在涨价阶段信息被price-in导致短期有效期短。相比之下,因子与估值的相关性更稳定,有效期更长。对应到概率模型,以kendall相关系数定义因子排序与估值排序的一致概率,进一步建立股票对间估值比较概率函数。

以足球彩票中比赛对阵胜负概率建模为类比,未来排序期望由比赛胜率累计推断,期望排序差即为估值提升潜力。此思想构成报告后续估值提升概率模型基础,赋予量化因子更深层的信息解释。[page::4] [page::5]

2.5 估值提升概率模型构建


  • 依据kendall相关系数拆解样本中股票对估值排序概率,即“高ROE股票估值更高”的概率函数 \(\varphi(d)\),其中\(d\)为ROE分位数差。

- 假设线性概率函数形式 \(\varphi(d) = \min(0.5 + \nu d, 1)\),\(\nu > 0\),表示因子差越大,高估值概率越高。
  • 利用所有成对股票对估计最大似然估计参数\(\nu\),赋予估值排序期望:


\[
E(Rk) = \sum{ik - ROEi) + \sum{j>k} (1 - \varphi(ROEj - ROEk))
\]
  • 计算估值提升空间:


\[
E(\Delta d) = \frac{E(R
k)}{n} - q(PB_k)
\]

其中q为当前PB分位数,差值越大说明未来估值提升空间越大,alpha潜力越强。

进一步可迭代用第二解释因子替换ROE转化成估值提升因子,提升模型复杂度和稳定性。

图3—4展示了线性概率函数模型和计算流程的示意。[page::6][page::7][page::8]

2.6 模型的扩展与参数估计


  • 参数估计方法为加权最大似然估计,权重根据股票对间距离确定,融合了kendall相关系数信息。

- 参数v估计展示了数学表达式,兼顾小样本极端估计不稳定问题。
  • 此外,模型可扩展为非线性函数,如logit函数,图5展示了sigmoid型的概率曲线,更符合实际估值分布趋势。


统计显著性测试及离散因子的处理也被探讨,为后续模型泛化打下基础。[page::8][page::9]

---

3. 图表深度解读



图1:估值因子连接基本面与情绪面


  • 左侧展示基本面因素(盈利能力、成长空间等)为长期、低频变量,右侧情绪因素(短期股价变动等)为短期高频变量。

- 中央估值因子为两者桥梁,强调估值即为基本面在市场价格层面的体现,但受市场情绪调节。
  • 说明股价可被模型拆解为估值变动和基本面变动,量化研究聚焦估值变动部分。[page::2]


图2:估值因子表现-市值分层法多头空头收益对比


  • 横轴时间跨度约2003-2019年,纵轴收益率或差异,深红线代表PB多头,浅红线PB空头,其多空收益差线路径平稳上升。

- PE因子展示同样趋势,支持估值因子长期有效。
  • 虽做空限制影响实现,数据验证估值因子可作为稳定alpha来源的基石。[page::3]


图3:线性概率函数示意


  • 展示\(\varphi(d)\)对不同参数\(\nu=0.3, 0.7\)的函数曲线,均从0.5(无差异概率)出发,随差值递增概率上升至或接近1。

- 曲线陡峭程度体现因子对估值排序影响力强弱。
  • 为概率模型构建提供显式函数便于实证估计和因子计算。[page::7]


图6与图7:Lift曲线对比分析(全市场与大盘样本)


  • 左图展示因子排名前N只股票中,高估值股票的数量,等概率线(基准)为线性且斜率0.2。

- 净资产和扣非ROE因子的曲线显著偏离基准线,净资产少和极端ROE值股票更易被高估值覆盖。
  • 右图转换为占比,显示高估值样本比例波动。

- 图7剔除小市值后(市值前1/3),净资产效应依然强烈,高ROE作用更明确,低ROE效应减弱。
  • 显现大市值样本中估值因子效果更为纯净稳定,指出研究重点应聚焦大盘样本。[page::10]


表1:不同行业因子与估值相关系数


  • 展现ROE、市值、净资产等因子在23个行业内与估值的相关性差异。

- 例如银行、医药、家电、食品饮料等消费板块中ROE与估值相关性较高,综合行业则呈负相关。
  • 消费行业中大市值龙头高ROE对应更高估值导致市值与估值正相关,验证了行业内因子差异带来的估值表现异质性。

- 支持行业分组估值概率函数参数估计的必要性和合理性。[page::10][page::11]

表2、表3:因子IC及IR全市场与市值前1/3样本对比


  • 表2显示全市场中估值提升因子(PB|ROE)对单纯PB因子提升有限,IR略有提高,因ROE单因子单调性差,影响整体因子效果。

- 表3显示大盘股样本中估值提升因子表现显著,IC从0.038提升至0.053,IR由1.08提升至3.255,说明估值提升因子在大市值样本中稳定有效。
  • 反映市场不同层次基本面因子有效性存在明显差异,强调因子分层处理的必要。


图8:各行业净资产与ROE中位数


  • 饼图及柱状图展示各行业的净资产和ROE中位数差异。

- 反映低盈利或亏损企业较多的行业,如综合,影响因子效果和估值逻辑的解释能力。
  • 有助理解因子在不同行业中表现稳健性的经济基础。[page::12]


图9:估值提升因子多空收益差时间序列


  • 展示2008年至2018年间各估值因子多空收益的累计倍数。

- 估值提升因子(带净资产中性处理及加入净利润增长率、毛利率)明显优于简单PB因子。
  • 显示13年、14年及18年部分时间段内有效性波动,与ROE因子短期失效相关。

- 该图间接展示估值逻辑有效期及市场风格演变对因子表现的影响。[page::13]

图10:估值提升因子多头和空头相对基准收益


  • 多头和空头对基准的累计超额收益几乎持平且约为8%年化收益,空头更为稳定。

- 数次估值逻辑变动导致多头组合在部分时间回撤,如2017年上半年。
  • 结合两边风险加权解释多空组合整体表现,辅助策略风险管理和资金配置决策。

- 说明稳定纯多头组合构建仍具挑战,但了解风险点及因子周期性表现有助优化策略。[page::13]

---

4. 估值提升概率模型的核心价值与金融解析


  • 核心逻辑:股价短期内估值波动占主导,投资者关注并能预测估值排序提升空间,从而获取超额收益。

- kendall相关系数应用:真实反映跨股票对因子与估值之间排序一致性的概率,超越传统单因子IC评估的局限性。
  • 概率函数构建:将估值提升基于因子分位数差的概率建模,明确从统计学角度量化“高ROE对应高估值”的合理度。

- 线性概率函数简化:作为首选模型易于估计与解释,参数\(\nu\)即估值排序提升的敏感性。
  • 迭代与模型稳健性:通过多因子迭代逐步剔除估值中的解释成分,实现对估值提升潜力更准确的分解与捕捉。

- 实证测试验证:数据处理合理,基于A股2008-2018年数据,涵盖市价波动、基本面和行业差异,模型高可靠性。
  • 分层与因子中性处理:解决市值、行业与估值间的内生相关性,提升因子表达效率。

- 风险揭示与模型适应度分析:明确ROE因子仅稳定于大盘样本,估值逻辑变动风险影响因子的时效性和预测能力。

这种融合统计学方法与金融估值逻辑的模型,为量化投资因子建构提供了全新思考路径,超越简单相关度检验,建立在排序概率和因果解释基础上的策略更稳健且解释力度强。[page::14]

---

5. 风险因素评估



报告中重点揭示两类风险:
  1. 估值逻辑突变风险:当市场环境变化导致估值因子(如ROE与PB)相关性剧变时,基于历史相关系数估计的概率模型失准,因子表现快速恶化,出现业绩回撤,典型如2017年部分时间段。
  2. 因子单调性局限风险:特别是ROE因子在全市场存在非单调(低ROE公司或亏损公司估值不低于某些盈利公司情况),限制了整个因子池贡献,导致全市场样本中估值提升因子表现受限。


此外,多头表现波动带来组合构建不稳定性,尤其空头表现稳定多头波动,需要在实操上加以平衡,避免利空时多头承担过大风险。

报告未详述具体的缓解策略,但隐含通过行业分层、样本筛选(市值前1/3)和多因子叠加迭代,增强稳健性。实际应用仍需关注因子有效性监控与动态调整,以应对经济周期和市场情绪影响风险。[page::14] [page::12]

---

6. 审慎视角与细微差别


  • 估值因子稳定性的假设限制:模型假设估值排序概率与因子排序间存在稳定函数关联,但实际中市场估值逻辑可能波动剧烈,模型需要不断重新估计参数,短暂的估值逻辑变迁期难以准确预测。

- 因子依赖样本选择:报告显示全市场样本含有大量亏损或低ROE公司,导致估值逻辑不清晰,模型效果下降,样本分层后提升明显,暗示估值因子不应盲目全覆盖。
  • 参数估计独立性假设弱化:最大似然估计假设股票对间估值比较独立,但事实上存在复杂的相关链条(排序传递性),可能引入偏差或估计误差。

- 单因子IC时效性差异明显:单因子(如ROE)短期可能出现反向表现,提醒投资者需结合估值因子和其他因子迭代优化,不能单纯依赖单因子。
  • 模型灵活性待拓展:线性概率函数为简化假设,实际估值影响可能更复杂,后续研究可引入非线性、事件类因子、数值方法深化模型表达。

- 实证期覆盖较长,但近期市场结构变化尚需验证:2018-2019后市场可能出现新的估值逻辑,报告未包含最新数据检验,建议谨慎外推。

整体而言,报告方法论严谨,但因子在市场风格转换期内存在波动性及有效期限制,用户需谨慎应用并结合动态风险管理。[page::14]

---

7. 结论性综合



本报告从量化视角出发,创新性地将股票估值提升问题形式化为相对估值排序的概率模型。通过kendall相关系数剖析因子与估值排序的一致性,引入概率函数与期望计算方法,准确量度基于因子分位数差的估值提升幅度,为选股因子构筑提供理论与实证支撑。

实证结果表明:
  • 市值前1/3样本中,结合ROE、净利润增速和毛利率构造的新型估值提升因子,IC和IR均显著优于传统简单PB因子,多空收益差从年化10.81%提升至16.45%,收益稳定性显著增加。

- 估值提升幅度成为具有前瞻性的alpha来源,尤其在考虑行业分层及因子中性化处理后表现更稳健。
  • 估值逻辑波动仍是因子周期性失效的主要风险,建议结合风险管理和模型动态调整。


图表全面支持了核心论断:
  • 图1及2说明估值是连接基本面和市场情绪的桥梁,估值因子驱动股价中短期波动。

- 图6和7的lift曲线展示因子对高估值股票捕捉能力的大小及市值分层影响。
  • 表1的行业相关系数揭示因子有效性存在显著行业差异,强调多样化模型设计。

- 表2和3以及图9、10的IC、收益差及收益拆解数据规范量化了因子表现和风险事件。
  • 概率函数图形(图3-5)形象展示模型设计思路和执行细节。


总体来看,本报告以概率模型创新拓展估值因子研究领域,加强对估值提升预期的量化把控,兼顾学理与实证,具备较强的理论价值和实操指导意义。关注大市值稳定样本的估值提升概率因子构造,对于A股量化多因子策略构建有重要启示和较好的应用前景。[page::0-14]

---

总体评价



报告逻辑脉络清晰,理论扎实,方法创新性强,实证样本覆盖周期长且详实,充分考虑行业、市值等多重维度影响,数据图表展现直观且统计检验充分。但报告也充分指出因子及估值模型在不同市场环境和周期内有效性波动,需警惕估值逻辑突变风险和样本选择偏差。建议结合动态风险管理和模型迭代完善,才能达到更稳定的alpha捕捉效果。

此报告无明显商业推广成分,分析深入且客观,为量化投资和基本面投资之间找到融合路径提供了崭新思路,值得业内专家和量化策略设计者细致研读与借鉴。

---

图表索引


  • 图1:估值因子连接基本面与情绪面

- 图2:估值因子表现-市值分层法收益差
  • 图3:线性概率函数示意

- 图4:因子计算流程示意图(文字版)
  • 图5:logit概率函数示意

- 图6:Lift曲线(全市场)
  • 图7:Lift曲线(市值前1/3)

- 图8:各行业净资产与ROE中位数
  • 图9:估值提升因子多空收益差

- 图10:估值提升因子多头和空头相对基准收益

---

备注: 所有结论和数据均基于报告内容,相关引用页码标注于文本句末,方便溯源和查验。

报告