PB-ROE 定价模型与残差因子初探
创建于 更新于
摘要
本报告系统梳理了经典PB-ROE定价模型,针对模型在A股市场中实证拟合效果不理想的问题,提出了基于折中ROE和离群值Winsorize的预处理方法显著提升回归结果。进一步引入Beta因子改善了收益预期解释能力,提升模型整体拟合度。基于改进模型的残差因子与常规估值因子关联度较高,且在因子有效性和投资组合回测中表现优异,显示其在低估值及价值动量策略中具备替代潜力和增强效果。为解决不同行业投资时长差异,尝试了行业及板块分层回归,验证了分层回归对改进模型的有限提升。整体来看,残差因子通过提纯ROE及引入风险因子显著提升了股价定价解释力,为估值与量化策略提供了理论与实践路径。[page::0][page::5][page::10][page::14][page::24][page::25]
速读内容
PB-ROE 模型理论框架与初步验证 [page::3][page::5]
- PB-ROE模型建立了对数市净率Ln(PB)与净资产收益率ROE的线性关系,给出截面定价公式。
- 通过沪深300、中证500等宽基指数回归测试,模型原始回归R2较低,且受离群值影响严重,特别是ROE存在极端负离群值。
- Ln(PB)-ROE散点图显示,大部分样本存在正线性关系,但离群点在中小盘股池影响明显。
离群值问题与折中ROE预处理方法 [page::7][page::10][page::11]

- Ln(PB)存在部分离群样本,采取5%Winsorize缩尾处理;ROE离群值尤为突出,采用折中ROE(基于头尾平均资产计算)并进行缩尾处理显著改善数据质量。
- 不同回溯期ROE平均对回归效果产生影响,最新截面ROE回归表现最佳。
引入Beta因子优化模型拟合效果 [page::13][page::14]
| 指标 | 沪深300 | 中证500 | 中证800 | 中证全指 |
|------|---------|---------|---------|---------|
| 引入Beta前R2均值 | 18.24% | 11.51% | 13.11% | 3.99% |
| 引入Beta后R2均值 | 25.19% | 14.59% | 17.44% | 7.03% |
- Beta因子解释个股风险与预期收益差异,与ROE呈一定负相关,共线性可控。
- 模型引入Beta后,整体调整后R2提升明显,尤其沪深300表现最佳。
行业及大类板块层面回归及表现 [page::16][page::17][page::18]
- 细分行业内模型拟合度整体偏低,多数行业调整后R2不足10%,拟合度排名前三行业为食品饮料、银行和医药,后三位为非银金融、纺织服装、石油石化。
- 按大类板块分类,成长与消费板块拟合优于周期、稳健和金融板块,引入Beta因子提升拟合度,但整体效果仍有限。
- 离群值及样本量影响细分行业回归效果,建议更精细聚类和降噪。
残差因子与常规估值因子对比分析 [page::19][page::20]
| 因子相关 | PBLF | PETTM | PSTTM |
|---------|--------|--------|--------|
| 相关性均值 | 约90% | 约50% | 约55% |
- 残差因子与PB相关性最高,均为正向,有较强定价方向性。
- 残差因子是Ln(PB)相对于PB-ROE拟合曲线的残差,有严格的估值锚点,区别于传统估值因子。
残差因子有效性及对估值因子的组合回测表现 [page::21][page::22][page::23][page::24]

- IC分析显示,残差因子IC优于PB和PS,接近或优于PE,行业中性显著提升因子稳定性。
- 基于残差因子和PBLF因子构建的低估值组合回测显示,残差因子组合在沪深300和中证500均取得更高年化收益与夏普率,且最大回撤更小。
- 残差因子结合动量构建的价值策略相比PE策略表现更优,回测区间2011-2021年,年化收益率19.01%高于PE的15.59%,风险指标更优。
结论与风险提示 [page::25][page::26]
- PB-ROE模型在理论上具备较好的截面定价思路,经过预处理、引入Beta后模型拟合大幅提升。
- 残差因子在解释股票估值偏离及投资实证中表现出较强有效性,能替代部分传统估值因子。
- 不同行业和投资时长的差异带来挑战,细分行业划分回归效果有限。
- 风险提示:因子有效性基于历史数据,未来市场环境变动可能导致失效,离群样本和回归模型敏感性存在潜在风险。
深度阅读
华泰研究《PB-ROE 定价模型与残差因子初探》全面分析报告
---
1. 元数据与概览
报告标题: PB-ROE 定价模型与残差因子初探
发布日期: 2021年11月23日
发布机构: 华泰证券
研究员: 林晓明、何康
核心主题: 探讨基于PB(市净率)与ROE(净资产收益率)的定价模型,分析其横截面拟合效果,提出数据预处理及引入Beta因子的优化方案,进而构建残差因子,并与传统估值因子如PB、PE、PS进行对比分析。
核心论点概述:
- PB-ROE模型由Jarrod Wilcox于1984年提出,理论上可通过线性关系解释股票估值,构建明确定价曲线。
- 模型在实际应用中受离群值影响较大,采用折中ROE及缩尾处理可显著提升解释力。
- 原模型中期望收益率k和投资时间T假设过于简单,引入Beta因子解释收益率k后模型解释力显著加强。
- 细分行业或板块回归效果有限,行业差异大且离群样本影响明显。
- 残差因子与常规估值因子高度相关,尤其与PB因子,且在特定场景下表现出优异的替代效果和投资价值。
---
2. 逐节深度解读
2.1 引言和主流定价体系局限(第2页)
- 报告指出,无论是折现模型(如DDM、DCF)、还是因子模型(CAPM、APT、Fama-French),都是寻找由基本面到价格的桥梁,但各自存在局限。
- 折现模型核心问题是远期现金流和折现率难预测,折现模型主观性强;相对估值法虽然广泛应用,但缺乏锚点,且不同指标(PB、PE、PEG、PEV等)难以跨行业比较。
- PB-ROE模型作为横截面定价模型的探索,试图解决估值与基础面间的线性关系问题。
2.2 PB-ROE模型及其数学推导(第3-4页)
- 原始模型基本公式为:
$$
\ln\left(\frac{P}{B}\right) = ROE \cdot T - k \cdot T
$$
其中P/B为市净率,ROE为净资产收益率,T为投资周期,k为区间期望收益率。
- 通过微分方程求解及忽略股息的假设,将P/B动态联系到ROE与k,推导为对数线性关系。
- 最终结果中假设期末P/B收敛为1,即取定价“锚”,简化为上述式子。
- 该模型给出价格与基本面之间横截面的线性锚定关系。
2.3 PB-ROE回归在市场上的实际拟合效果(第5-6页)
- 在沪深300、中证500、中证800及全指估计历史区间(2011-2021)进行Ln(PB)对ROE的线性回归。
- 结果显示拟合度R2普遍较低(例如沪深300最高平均12.38%),且在中证全指中相关性甚至跌至不足2%,拟合效果远低于预期。
- 斜率项更多为正,但在全指中斜率为负比例较高,且截距均显示为正,暗示期望收益率k为负,与现实不符。
- 散点图进一步显示存在严重离群值,尤其ROE负偏离极端严重,影响回归拟合与系数合理性。
2.4 基础指标分布及预处理思路(第7-11页)
- PB表现较为稳定,离群值相对较少且多为上侧,偏高估值多见于小盘股;ROE离群严重,尤其在负侧离群值极度极端,源于低净资产导致比值失真。
- 具体分析样本中极端ROE样本,负值主要因资产净值骤降导致分母接近零。正向极端ROE则有较多非经常性损益影响。
- 针对不同性质,PB采用简单Winsorize缩尾处理;ROE则采用对期初和期末权益平均后的折中ROE计算,缓解盈亏对ROE数值的不对称影响,随后同样缩尾处理。
- 实测不同回溯期ROE(近1、3、5年)结果表明,长期平均ROE反而降低拟合效果,最新截面ROE信息时效性更强,实证结果支持使用最新折中ROE预处理。
- 预处理后,回归R2显著提升,沪深300超过18%,中证500超11%,全指也翻倍,斜率均显著且全正,但截距仍普遍显示正值。
2.5 PB-ROE模型的优化思路:引入Beta因子与探讨投资期T差异(第13-18页)
- 原模型假设投资期望收益k为常数,所有股票收益率一致;这一假设不符经典CAPM或多因子模型,预期收益应与风险匹配。
- 通过计算股票历史Beta(使用指数加权回归),引入Beta解释期望收益率k,令:
$$
ki = \betai (rM - rf) + r_f
$$
- 引入Beta因子后,回归拟合优度提升明显,沪深300调整后R2提升至25%以上,Beta系数多为正,部分股票池存在共线性,但整体可控。
- 对投资期T,文中指出其人为设定为所有股票统一收敛至PB=1有偏误,现实中不同股票估值收敛期大相径庭。
- 行业内相似股票因产业周期接近,期望投资时间T可能具备共性,故尝试分行业、板块回归。
- 分中信一级行业回归及加入Beta因子后,拟合度变化不大,多数行业拟合R2不足10%,且受离群值严重影响。
- 将行业维度扩展到大类板块,样本增多后,成长和消费板块内拟合度有所改善,金融、周期、稳定板块拟合度仍较弱。介绍细分行业数据散点图进一步展现回归差异。
- 结论认为细分行业内离群点及噪声较多,聚类降噪可能为优化方向。
2.6 残差因子解析及与传统估值因子的比较(第19-24页)
- 基于优化后的PB-ROE模型(包含Beta因子回归),利用回归残差作为估值因子。残差因子数量体现股票相对定价的溢价或折价方向和幅度。
- 通过秩相关分析发现,残差因子与PB高度相关(相关系数80%以上),而与PE、PS等相关性相对较低。
- 进一步解析残差因子与PB及PE的理论关系:
- PB因子等同于ROE回归不显著时的残差因子,即残差因子为PB剔除ROE解释后的剩余部分。两者存在较大重合,且多数样本位于方向一致区。
- PE因子为PB与ROE的乘积,隐含非线性关系,残差因子与PE存在曲线和定价差异区间,特别是低ROE区域。
- 因子有效性验证(IC分析)表明,残差因子超过PB和PS,在四季度报告期数据时稍弱于PE,但月末高频数据中表现超越PE,行业中性化显著提升残差因子稳定性。
- 低估值组合回测显示:残差因子选出的低估值股票组合长期收益率和风险调整指标均优于PB因子,尤其在中证500池中优势显著。
- 残差因子结合动量构建的价值动量策略再平衡组合在中证800范围内表现出明显超越传统PE因子构建策略的优势,年化收益19.01%优于PE的15.59%,回撤和夏普率亦有所改善,尤其在2018年后表现分化明显。
2.7 总结(第25页)
- PB-ROE模型理论上为基于横截面的定价模型提供了明确结构,但实际应用中受离群值、指标定义及收益率分布限制。
- 针对极端离群值采用折中ROE和Winsorize处理后回归解释力提升显著。
- 引入Beta因子解释期望收益率k,显著提升模型拟合度,体现风险因素的定价能力。
- 投资期T的统一假设不实际,行业或板块划分尝试无明显提升,离群样本和噪声是限制因素。
- 残差因子构建的价值因子在有效性和策略表现上表现优于传统PB因子,对PE策略存在合理的替代性,提纯ROE是提升表现方向。
- PB-ROE模型为截面定价提供了一条理性路径,未来应注重风险因子扩展和噪声控制以提升适用性。
---
3. 图表深度解读
图表1(第2页):“优质估值模型的要素”
- 定义了理想估值模型三大指标:经济学逻辑(基于企业基本面且符合经济规律)、简约性(较少且易获取的参数)、普适性(适用所有时间和截面),为后文评判PB-ROE模型做理论铺垫。
图表2-3(第5页):宽基指数Ln(PB)-ROE回归拟合度及参数
- R2均值从沪深300的12.38%向市场范畴扩大显示下降趋势,部分指数中斜率甚至呈负值,截距均为正,表明简单模型难以捕捉复杂市场信息,且估计偏离实际逻辑。
- 体现模型初次实测的局限性与需要考虑数据预处理的必要。
图表4-5(第6页):散点图展示不同指数股票 Ln(PB)与ROE关系,明显离群值冲击
- 沪深300表现较好的线性结构,中证500、中证800及全指受离群值(极端负ROE样本)严重干扰,导致拟合失真。
图表6-9(第7-8页):PB与ROE分布箱线图
- PB整体分布稳定,仅存在头尾偏高离群,尤其小盘股影响明显。
- ROE离群严重,尤其负值大幅偏离中位,存在统一会计口径下企业亏损导致净资产接近零的极端表现。
图表10-11(第8页):典型负、正离群值企业财务数据实例
- 负侧离群样本因极端资产减值导致ROE虚高;正侧离群则多受非经常性损益扭曲,显示数据百科定性说明。
图表12-14(第10-11页):不同ROE回溯期对拟合影响及预处理效果对比
- 以最新折中ROE处理配合Winsorize,明显提升模型拟合优度与斜率的显著性,验证优化数据处理的有效性。
- 图表15为流程图总结对应处理方式,清晰表达逻辑。
图表16-17(第12页):预处理后散点图明显改善线性关系,离群干扰减弱
- 预处理后各指数样本中线性特征显著增强,尤其是沪深300与中证500,验证模型改进效果,但仍存在部分低ROE高PB样本影响回归。
图表18-20(第14页):引入Beta后的回归表现及因子相关分析
- 引入Beta后,R2平均涨至15%-25%,Beta因子显著性较高,大盘股更明显。
- Beta与ROE呈一定负相关,存在一定共线性但不影响模型实用。
- 截距项显著变低或负值,提示引入风险溢价因素后模型对投资期望的更合理刻画。
图表21-25(第16-18页):行业与板块分组回归表现
- 分行业回归R2较低,多数低于10%,且受限样本规模及离群值影响严重。
- 大类板块划分略微提升拟合,但整体效果仍有待提升,成长消费板块拟合较好,周期稳定板块表现欠佳。
- 与细分行业对比,大类板块样本量足够,离群样本影响减弱。
图表22-23(第17页):行业层面拟合度差异的回归散点图示范
- 拟合优异的食品饮料、医药行业展示较强线性,银行因样本少拟合统计不完全可靠。
- 拟合差的非银金融、纺织服装及石油石化行业散点无明显线性,且样本有限。
图表26-27(第19-20页):残差因子与传统估值因子相关性
- 残差因子与PB相关系数稳定约90%,与PE和PS相关相对较低,说明构建的残差因子实质与PB因子紧密,兼具更多价值动量潜力。
图表28-31(第20-21页):残差因子与PB、PE因子理论示意图
- 展示残差因子与传统因子在二维空间中定价判定的差异区分,残差因子具有相对明晰的定价锚点和方向性。
- PE曲线为非线性对数函数,定价差异区域更复杂且交叉。
图表32-35(第21-22页):残差因子IC性能对比及累积表现
- 残差因子IC优于PB和PS,与PE相当,在行业中性化后表现更稳定。
- 不同股票池中,IC波动度符合常规因子表现,残差因子表现稳健。
图表36-38(第23页):基于残差因子与PB构建低估值组合回测
- 残差因子构建组合在沪深300和中证500均优于PB组合,年化收益和风险调整表现明显优越,最大回撤较小。
图表39-41(第24页):基于残差因子与PE构建价值动量组合的绩效比较
- 残差因子价值动量策略年化收益19.01%较PE动量策略15.59%显著提高,同时波动率与回撤更优,尤其2018年以来优势更为明显。
---
4. 估值分析总结
- 模型核心估值方法:通过对数市净率 \( \ln(P/B) \) 与ROE的线性回归,解释股票在横截面上的价值分布,拓展为加入Beta因子的多元线性回归,内嵌预期收益率的风险调整。
- 关键假设:
- 期望收益率k为常数(原模型);引入Beta后与系统风险相关。
- 投资期限T为固定,短时间内PB趋同(现实中分行业分异调整)。
- 股息项被忽略或影响较小。
- 关键输入:最新折中ROE,Beta(指数加权回归),无风险利率及市场风险溢价。
- 估值结果:回归残差被用作估值因子,反映实际价格与理论估值的偏离,提供高估低估信号。
- 敏感性与局限:极端离群值、行业差异和样本分布对拟合结果影响明显。残差因子优于简单PB因子,但仍存模型结构及信息时效限制。
---
5. 风险因素评估
- 回归模型对样本分布敏感:极端离群值、尤其是ROE极端负值严重扭曲拟合结果,需要严谨数据预处理。
- 市场规律变化风险:因子基于历史样本总结,规则若发生根本变化,回测效果可能失效。
- 行业与时间异质性:不同股票和行业对T和k的假设差异大,导致行业内回归表现不稳,存在覆盖不足风险。
- Beta因子解释力波动:Beta对预期收益率的估计存在偶然性,且有一定共线性影响,模型可能遗漏其它风险因子。
- 策略回测局限:净值和业绩测算基于历史,不能保证未来持续有效,且忽略了交易成本、流动性等实际因素。
---
6. 审慎视角与细节
- 模型假设理想化:尽管加入Beta因子改善了拟合,但投资者对未来收益的预期和投资期限难以统一定义,部分假设可能对定价偏差贡献较大。
- 产业周期及结构变迁影响不足:模型未充分考虑公司生命周期和行业动态对ROE和PB的影响,行业内差异大和时间变异性未能很好纳入。
- 样本离群影响严重:大量极端负ROE带来的严重影响尚未完全消除,预处理虽改善拟合但难免残留噪音。
- 模型解释力有限:即使最佳状态,调整后R2普遍偏低(多低于30%),说明还有大量定价因素模型未覆盖。
- 行业回归效果不佳的潜在原因:颗粒度细化导致样本减小、噪声影响放大,现有聚类分组尚不足以刻画成分股间的复杂关系,需求更细致的因子或机器学习聚类优化方案。
- Beta因子的显著性和方向性不一:特别在小盘股更多的指数,Beta解释力及正向比例下降;市场风险溢价实际波动及非系统风险因素可能被忽略。
- 残差因子优势具有限制:尽管残差因子整体优于PB,在动量策略中优于PE,但IC稳定性不及PE,表明在不同市场环境下波动较大。
---
7. 结论性综合
华泰证券的本份研究报告系统地解析了PB-ROE定价模型在中国A股市场上的应用及改进可能。通过大量实证分析,揭示了模型在样本极端值、指标定义及稳健性方面的缺陷,构建了基于折中ROE和缩尾处理的预处理体系,并创新地结合Beta系统性风险因子,对期望收益率k进行分异解释,提升模型的拟合准确度和定价解释能力。
基于优化后的模型,回归残差被提炼为新的估值因子,体现了价格的相对偏离和估值溢价。该残差因子与传统PB因子高度相关,且在行业中性化后的稳定性和有效性优于PB和PS因子,且在动量价值策略的实证中表现出超越PE因子的优异业绩,特别是在中证800的低估值样本空间内,增强了投资者在价值溢价识别和利用方面的能力。
报告客观指出,尽管模型优化已有明显进展,潜在风险仍然存在,诸如极端离群值的影响、行业和市场动态的异质性、以及未来市场规律变动可能导致回测失效的风险。行业与板块维度的细分回归未能显著提高拟合效果,表明策略聚焦度和数据处理仍需改进。
本报告整体立足于谨慎求实的态度,提出了基于PB-ROE定价模型结合风险因子的学理框架,并通过严谨的实证回测验证,表现出残差因子在价值策略应用中的可行性和潜力,为量化投资者和资产管理者提供了一条具有良好理论基础和应用前景的估值工具路径。下阶段研究应聚焦于改进行业样本聚类优化、探究多因子模型融合,以及动态时间窗口及多市场环境适应性调节,以提升因子的稳健性和预测能力。
综合上述,报告对PB-ROE模型进行了深度剖析和细致优化,确认了模型在合理定价及价值因子构建方面的价值,且提出的残差因子具有良好的实际效果和潜在代表性。报告整体视角严谨,分析全面,数据充分,既有理论深度也有扎实的实证支持,值得业内关注。
---
重要图表展示
残差因子价值动量策略净值对比(2011-2021):

累计因子IC:

残差因子与PB低估值组合净值(沪深300):

残差因子价值动量策略与PE因子策略净值:

---
溯源
[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25]
---
(本分析严格按照原报告内容进行,避免了主观评价和非报告内容推断,确保专业性与溯源明确。)