Conditional and Unconditional Quantile Regressions for Fama-French Factor Models
创建于 更新于
摘要
本论文研究了Fama-French三、四、五因子模型中条件和无条件分位数回归(CQR与UQR)方法的异同与效果。结果显示,因子载荷在资产收益分布的不同分位数存在显著差异,尤其在极端分位数(尾部)与均值回归的OLS估计存在明显偏差。UQR估计提供了更为清晰且易解释的因子效应,且置信区间更窄,为理解市场风险的不同状态下的表现提供了重要视角,有助于资产定价及因子投资策略设计 [page::0][page::1][page::2][page::8][page::9][page::10][page::13][page::17]。
速读内容
研究背景与方法介绍 [page::0][page::1][page::2][page::3]
- Fama-French因子模型扩展了CAPM,引入规模(SMB)、价值(HML)等因子,成功解释资产收益。
- 传统OLS回归聚焦均值效应,忽视了因子对收益分布不同分位数的影响。
- 条件分位数回归(CQR)和无条件分位数回归(UQR)两种分位数回归方法被引入,前者针对条件分布,后者针对无条件分布,后者解释性更强。
- 论文基于Kenneth French提供的月度因子数据(1963-2024),测试不同分位数下的因子载荷变化及稳健性分析。
数据描述与样本特征 [page::6][page::7]
| 因子/组合 | 最小值 | 中位数 | 最大值 | 平均值 | 标准差 | 偏度 | 峰度 | 正态性检验(JB) | AR1 | ERS单位根检验 |
|-----------|--------|--------|--------|--------|--------|------|------|----------------|-----|--------------|
| MKT | -23.24 | 1.01 | 16.10 | 0.58 | 4.48 | -0.50| 4.72 | 121.42 | 0.04| -14.33 |
| SMB | -17.20 | 0.09 | 21.36 | 0.17 | 3.05 | 0.44 | 7.65 | 685.72 |0.05 | -15.14 |
| HML | -13.88 | 0.20 | 12.80 | 0.28 | 3.00 | 0.09 | 5.22 | 151.93 |0.16 | -11.46 |
| MOM | -34.30 | 0.72 | 18.20 | 0.61 | 4.20 | -1.30|12.65 | 3052.44 |0.04 | -15.73 |
| RMW | -18.65 | 0.26 | 13.07 | 0.29 | 2.22 | -0.28|13.89 | 3634.06 |0.16 | -15.43 |
| CMA | -7.20 | 0.09 | 9.07 | 0.26 | 2.07 | 0.27 | 4.45 | 72.97 |0.14 | -9.25 |
- 样本中各因子和资产组合收益具有明显偏态和厚尾特征,Jarque-Bera检验均拒绝正态性。
- 时间序列表现出较弱的一阶自相关,单位根检验都拒绝非平稳假设,说明数据为平稳序列。

分位数回归主要结果 — 三因子模型FF3 [page::8][page::9][page::10]
- CQR估计(图2)中,因子载荷普遍呈现上升趋势,ROBUST与OLS结果接近但存在偏差。
- UQR估计(图3)因子载荷呈明显的“U”型分布,高低极端分位处载荷较高,中间较低,反映极端市场状态下系统性风险暴露增强。
- OLS估计可能高估了正常区间的系统性风险,低估了极端状态的风险,提示分位数回归能更精准反映风险分布。
- UQR置信区间较窄,波动性小,稳健性更强。
分位数回归主要结果 — 四因子FFC4与五因子FF5模型 [page::11][page::12][page::13][page::14][page::15]
- 四因子模型增加动量因子MOM,UQR显示动量因子载荷在低分位正相关,高分位负相关,虽罕显著但表明风险依赖状态变化。
- 五因子模型增加盈利能力RMW和投资风格CMA,UQR结果相对平稳,载荷趋近OLS水准,极端分位数有所偏离。
- 各模型因素载荷表现与三因子模型趋势一致,增添因子并未根本改变分位数关系,模型拟合稍有提升。


行业组合的分位数回归结果与稳健性分析 [page::13][page::24][page::25]
- 行业组合回归结果相较大小盘组合更不稳定,因子载荷分布更为分散且部分行业因子表现为负,反映行业特性差异。
- 总体拟合度方面,UQR拟合整体表现优于CQR,特别在极端分位数拟合更佳。
- 递归系数回归结果显示,自2000年代初以来,因子载荷在不同分位数上总体稳定,极端分位数间变化大于时间序列变化。

结论与投资启示 [page::17]
- 分位数回归特别是UQR在捕捉极端市场环境下的因子风险暴露有独特优势,传统OLS估计的均值视角不足以反映尾部风险。
- UQR提供的更精准和解释清晰的因子载荷,可帮助投资者更好地理解和利用熊牛市下的风险异质性。
- 结果呼应行为金融中的前景理论,投资者对损失有风险偏好与收益时风险厌恶,表现为低收益时高β偏好,高收益时低β偏好。
- 未来研究可以将分位数回归应用于预测回归框架,深入挖掘因子在未来不同收益分布位置的预测能力。
深度阅读
金融量化研究报告详尽分析报告
报告标题: Conditional and Unconditional Quantile Regressions for Fama-French Factor Models
作者: Jens J. Krüger
机构: 德国达姆施塔特工业大学经济与法律系
发布日期: 2025年6月
研究主题: 探讨Fama-French因子模型下条件与无条件分位数回归方法在股票收益分布上的应用与比较
---
1. 元数据与报告概览
本报告以Fama-French多因子模型为研究对象,系统比较并实证分析了传统基于OLS的均值回归与两种分位数回归(条件分位数回归,CQR和无条件分位数回归,UQR)在估计股票组合收益分布中因子载荷的表现差异。作者指出,现有实证金融分析中极少使用分位数回归方法,本文填补此空白,尤其强调UQR在解释无条件收益分布量化因子影响上的优势。通过对3因子、4因子(加入动量因子)、5因子(再加入盈利能力与投资因子)模型多样组合的实证,揭示了传统OLS估计或CQR对收益极端分位数下因子定价影响的不足,强调UQR在尾部分位上的显著差异及其在风险管理和策略制定中的潜在价值。报告核心信息是分位数回归特别是UQR能提供比均值回归更丰富、更准确的风险信息,值得在量化投资策略中广泛采用[page::0,1,2]。
---
2. 逐节深度解读
2.1 引言(第1-2页)
报告开篇详述因子模型的发展历程,强调Fama-French模型在股票收益解释中的成功,并指出传统使用最小二乘法(OLS)仅估计收益均值下因子影响,忽视收益分布不同部分的动态。文中提出量化分位数回归的应用不足,归因于CQR的解释复杂性。报告认定风险管理尤其关注收益分布的尾部(极端收益事件)变化,这正是分位数回归的优势。正因如此,作者建议采用Firpo等(2009)提出的UQR方法,将因子影响定位在无条件收益分布特定分位数,更易解释且更符合资产定价需求。文中还补充了稳健回归方法的使用,指出金融数据普遍存在厚尾特征(高峰态),稳健方法在异常值处理上更有效。本文在多因子模型不同回归方法下全面比较因子载荷的表现[page::1,2]。
2.2 方法论:分位数回归变体(第3-5页)
本部分数学化定义了传统CQR和UQR。
- CQR: 以最小化加权残差(check-function)为目标函数,估计的是在给定其他因子条件下收益的分位数,因此载荷解释为“在特定因子水平条件下”对应分位数的收益变动。此带来解释难度,因为载荷依赖于“条件”变量水平,无法直接映射到总体无条件收益分布。
- UQR: 利用重心影响函数(Recentered Influence Function, RIF)回归,其目标是估计因子对整体无条件收益分布中分位数的影响,载荷类似OLS估计直接对应收益分布的变化,而非条件分布。计算中,RIF借助该分位数的估计值和对应概率密度函数的核估计,进行OLS回归。
理论上,UQR估计的载荷较易解释且更符合金融因子定价“整体收益动因”的研究目标,这对时间序列多因子回归尤为重要[page::3,4,5]。
2.3 数据与模型规范(第5-7页)
数据来源于Kenneth French数据集,使用1963年7月至2024年9月的月度数据。考察的因子包括:
- MKT(市场因子:市场超额收益)
- SMB(市值因子:小盘股减大盘股)
- HML(账面市值比因子:价值股减成长股)
- MOM(动量因子)
- RMW(盈利能力因子:高盈利减低盈利)
- CMA(投资风格因子:保守投资减激进投资)
模型组合包括经典3因子模型(FF3)、4因子(FFC4,加入MOM)、5因子(FF5,加入RMW与CMA)。测试组合包括2×3市值与账面市值组合及5个行业组合。附带全面描述性统计,展现金融因子和组合收益返回的相关统计量与特征,体现出金融市场收益的厚尾(超峰态/高峰度)与轻微负偏态,单位根测试结果支持序列的平稳性[page::5,6]。
2.4 描述性统计(第6页)
表1详细列出因子和组合收益的最小值、最大值、均值、中位数、标准差、偏度、峰度、Jarque-Bera正态检验以及自相关和单位根检验。结果显示所有变量均展现典型金融时间序列特征:正均值、较大波动率、负偏度及明显峰态(峰度远大于3),Jarque-Bera对所有序列均拒绝正态假设。时间序列体现在一阶自相关系数不高但显著,结合单位根检验显示收益序列是弱平稳的。内生金融危机事件(1987年股灾、2000年科技泡沫破裂、2008年金融危机以及2020年疫情崩盘)事件的极端影响在偏度与峰度中得以体现。综合箱线图(图1)直观显示异常值的广泛存在及影响程度[page::6,7]。
---
3. 图表详尽解读
表1(第6页)
内容: 因子与测试组合收益的基本统计特征及单位根测试结果。
解读: 反映了市场以及因子收益的厚尾性质、非对称分布及平稳性,提示传统OLS可能受异常值影响,而分位数及稳健回归方法更能捕捉收益分布整体性特征。
价值: 支撑下文模型选择,理由充分且统计表现符合理财数据的现实特征。
图1(第7页)
内容: 因子、2×3组合和5行业组合收益的箱线图。
解读: 盒须延伸显示收益分布范围,多数变量存在大量异常高/低值,且明显超过1.5倍四分位距的异常点提示。
联系: 进一步说明数据厚尾特征,提示稳健及分位数方法必要性。图表的设计清晰表达了收益离散与偏态,理论支撑文本对市场异态的描述。
图2与图3(第9和第10页) - FF3模型下CQR与UQR回归结果
- 图2(CQR):
各因子在0.05至0.95分位数的载荷变化曲线及置信区间,通过灰色区域展示。配有OLS(虚线)与稳健回归(点线)对比线,反映载荷的平均水平。
- 载荷一般性表现符合Fama-French经典文献:市场载荷近似1,小盘股具有较大SMB载荷,价值股HML载荷较大。CQR载荷呈一定的上升趋势,但总体形态较为平缓。
- 稳健回归载荷多低于OLS,说明OLS对异常值敏感。
- 图3(UQR):
- 显示出明显的∪形曲线,市场因子载荷在收益分布两端(极端亏损与极端盈利)显著高于中心部分,说明极端行情下市场风险因子影响加剧。
- SMB和HML因子的载荷也呈类似U型,尾部效应明显,特别是在小盘组。
- UQR置信区间明显更窄,表明估计更有力且更精确。
- 综合见解:
- UQR相比CQR更鲜明且易于解释,因其估计的是整体收益分布的分位数效应,适合强调尾部风险管理。
- OLS均值回归在极端分位数市场表现下表现不足,可能导致风险低估。
- 估计结果对投资组合风险评估与资产配置具有重要启示[page::9,10]。
图4与图5(第11与第12页) - 四因子模型 CQR与UQR
- 加入了动量因子(MOM)。
- 3个经典因子的载荷形态与FF3模型相似,动量因子载荷整体均值附近波动。
- CQR动量因子载荷无明显量化趋势,波动较大且无显著性。
- UQR呈下降趋势,动量在回报分布左端(亏损时)载荷正值,分布右端(盈利时)载荷转负,这暗示动量因子在亏损极端行情阶段对资产的风险贡献较大,盈利阶段效应减弱。
- 置信区间虽宽,但模式连续性强,动量因子可能存在尾部风险识别意义[page::11,12]。
图6与图7(第13与第15页) - 五因子模型 CQR与UQR
- 加入盈利能力(RMW)和投资风格(CMA)因子。
- 经典因子载荷基本稳定,动量载荷不变。
- RMW与CMA因子的载荷均较小,除尾部极端处存在偏离。
- UQR估计更接近OLS,特别是在中间部分,尾部差异显著。
- CQR估计的RMW和CMA载荷表现不规则、趋势不明显,解释力有限。
- 说明新因子对整体回报解释力有限,但尾部效应仍然重要[page::13,14,15]。
附录A(第24-29页) - 产业组合分析
- 产业组合较测试组合表现出更弱的模型拟合度。
- UQR中的市场因子MKT载荷依然呈显著的∪形态,体现尾部风险重要性。
- SMB与HML的影响较产业组合间异质,尾部载荷更为极端且不稳定。
- MOM因子在产业组合中表现各异,CQR载荷无明显规律,UQR显示下降趋势。
- RMW与CMA因子多为空载荷,部分产业表现出显著偏离,显示特定产业对盈利能力和投资风格因子的敏感度不同[page::13,24-29]。
附录B(第31-63页) - 递归估计稳定性分析
- 利用递归样本估计方法检测估计的时间稳定性。
- 初期样本估计不稳定,样本扩展后估计趋稳,尤其是2000年以后稳定性较好。
- 低分位(下尾)载荷相对较高,高分位载荷相对较低,表现出因子在极端低收益阶段风险暴露较大。
- MKT载荷在80年代初、2000年及2007-9金融危机期间波动显著。
- SMB、HML因子随着样本增长表现趋向同一水平,但仍有部分组合表现异常。
- 新加入的MOM、RMW和CMA因子载荷递归估计也显示部分收敛与稳定性,反映因子定价机制与结构有进化但总体稳健[page::16-17,31-63]。
---
4. 估值分析
本报告不直接涉及估值模型如DCF或倍数法,而着重于因子载荷的统计估计和分析,故此部分不涉及传统估值框架。但通过分位数回归捕捉的因子载荷有助于调整风险溢价及尾部风险预期,从而间接影响资产估值和投资组合组合选择。
---
5. 风险因素评估
报告聚焦风险主要体现在:
- 因子载荷对收益分布尾部的异质性:尾部高载荷可能诱发极端亏损,风险加剧。
- 厚尾及异常值数据特性:OLS估计易受影响,稳健与分位数回归缓解部分风险识别偏差。
- 方法选择风险:传统CQR解释受限,易产生误导,UQR虽更具解释性,但实务推广较少。
- 数据及模型不确定性:递归估计显示估计稳定性随时间波动,反映市场风险特征时变。
缓解策略主要是推广使用UQR和稳健回归,加强尾部风险监控和动态风险管理[page::1,2,4,16].
---
6. 批判性视角与细微差别
- 报告强调了UQR相较CQR在无条件分布解释上的优势,但对CQR的局限批判较严,未对CQR在特定场景(如分层分析)实际应用中可能的理论优势展开充分论述。
- 分析中对稳健回归的讨论留有空间,未系统呈现其与分位数回归结果的定量比较。
- UQR的核密度估计对参数估计的影响未详细探讨,可能影响估计稳定性。
- 报告未涉及多期预测(虽提及预测性研究方向),未来可进一步考察动态因子载荷变化与市场状态预测能力。
- 数据期限长,但未细分不同时代市场结构变化对载荷估计的系统影响。
综上,报告观点鲜明且数据充分,方法严谨,但对其他方法潜在补充价值及模型扩展预期略显简化,建议结合多种方法综合分析以增强稳健性和预测力[page::1-5,16,17]。
---
7. 结论性综合
本报告系统比较了OLS均值回归、稳健回归、条件分位数回归(CQR)与无条件分位数回归(UQR)在Fama-French多因子模型因子载荷估计中的表现。通过1963至2024年Kenneth French数据,涵盖经典、动量、盈利能力和投资因子,实证检验了6个股票测试组合(2×3市值账面价值排序组合及5个产业组合)。
- 结果验证了金融市场收益的厚尾特征,OLS估计对极端尾部风险的捕捉存在盲区。
- 分位数回归揭示资金风险暴露在收益分布不同部分差异显著,尤其尾部。
- UQR较CQR更适合因子风险的无条件分布解读,提供更具解释力和更稳定的载荷估计。其量化的∪型特征体现了市场因子在极端亏损和盈利时期风险贡献放大。
- 3因子模型中UQR载荷显示风险敞口尾部升高,动量因子(4因子模型)的尾部贡献亦明显,5因子中新增因子贡献整体偏低,尾部偶有显著载荷。
- 递归估计显示自2000年代起因子载荷稳定性增强,但因子对不同收益分位数的反应始终存在显著差异,提示动态风险管理重要性。
- 结果与行为金融学观点(如前景理论)相呼应,投资者风险偏好与损失规避体现在分位数回归载荷曲线中,如低分位时偏好高风险碎片。
- 本研究为量化投资和智能贝塔策略提供了实证支持,特别强调利用UQR获取的分位点因子载荷,提升极端市场状态下资产配置和风险控制的有效性。
- 未来研究可拓展到预测性回归,基于滞后因子检验分位数风险预测能力,进一步深化资产价格动态理解。
整体来看,报告严谨系统地说明了因子风险在收益分布各部分的非均质性,明确了UQR作为实证工具的优势和实用价值,拓展了经典资产定价分析视角,具有较高的学术与应用价值[page::0-17]。
---
附录图表示例
- 图1: 因子及投资组合收益箱线图,突出显示厚尾和离群点分布。

- 图2: 三因子模型(CQR)各因子分位数载荷估计与OLS/稳健估计对比,展示载荷随分位数变化曲线与置信区间。

- 图3: 三因子模型(UQR)因子载荷的∪形特征及置信区间,相较CQR置信更紧,解释更直观。

- 更多图示详见正文及附录完整列表,反映不同模型与组合下分位数载荷的差异与动态稳定性。
---
总结: 本报告通过量化方法展示了分位数回归在资产定价中的关键作用,特别凸显无条件分位数回归在极端风险度量与解释上的优势。研究强化了风险分布异质性在投资组合管理及理论模型中的重要性,推动资产定价实证分析的视角从均值向分布全貌转变。
若引用本文重要结论,则请在句末标注对应页码,如[page::9,10]等,便于溯源验证。