选股因子系列研究(二十七)——分位数回归在多因子选股中的应用
创建于 更新于
摘要
本报告系统介绍了分位数回归(QR)方法在多因子选股中的应用,指出其较传统均值回归(OLS)在不满足正态与同方差假设下更具稳健性。通过实证分析中证500成分股,采用前一个月收益率、日均换手率和总市值三个因子,证明不同分位点对收益率影响差异显著,尤其0.1分位数回归模型(QR(0.1))能更准确反映股票未来表现差异并构建增强组合,实现显著超额收益和夏普比率提升,且换手率无明显增加,提示该方法具有较好实用价值和稳健性 [page::0][page::4][page::5][page::6][page::8][page::9][page::10][page::11]
速读内容
- 分位数回归(QR)概念及优势 [page::4][page::5]


- QR不要求数据正态同方差,稳健性强。
- 能研究因子对收益率整体分布不同分位点的影响,而非均值。
- 单因子中,前一个月收益率0.1和0.9分位点斜率与均值回归显著不同,表明反转效应和不同风险水平表现有差异。
- 各因子对收益分布分位点影响差异 [page::6]




- 换手率因子对不同分位点收益影响较为均匀。
- 总市值因子则显示大市值股票收益更分散,极端分位点差异显著。
- 多因子分位数回归模型实证及系数动态分析 [page::8]




- τ=0.1分位点系数估计最稳健,τ=0.9波动最大。
- 与均值回归相比,0.1分位数能更准确捕捉因子效应变化。
- 不同回归方法选股组合收益比较 [page::8]
| 组合 | OLS (等权) | QR(0.1) (等权) | QR(0.5) (等权) | QR(0.9) (等权) | OLS (市值) | QR(0.1) (市值) | QR(0.5) (市值) | QR(0.9) (市值) |
|--------|------------|----------------|----------------|----------------|------------|----------------|----------------|----------------|
| D1 | 12.34% | 19.71% | 15.98% | 2.49% | 9.61% | 17.95% | 12.59% | 0.62% |
| D1-D10 | 18.89% | 28.83% | 22.64% | 1.69% | 17.42% | 27.34% | 20.51% | 1.26% |
- QR(0.1)组合表现显著优于OLS和其他分位点,提升收益和组合区分度明显。
- 中位数QR表现与OLS接近,QR(0.9)效果最差。
- 选股组合累计净值和相对强弱图示及风险收益特征对比 [page::9][page::10]




- QR(0.1)多头组合累计净值及相对强弱明显优于OLS,尤其2011年后优势显著。
- QR(0.1)组合夏普比率和超额收益优势明显,且换手率无明显上升。
- 分年度收益及风险收益特征明细 [page::10][page::11]


- QR(0.1)除2008和2017年表现弱于OLS,其他年份均取得稳定超额收益。
- 风险收益指标显示QR(0.1)夏普率高于OLS,回撤及波动类似。
- 该结果验证了分位数回归模型的稳健性和实际应用价值。
- 量化多因子模型策略总结 [page::0][page::8][page::9][page::10][page::11]
- 构建以前一个月收益率、换手率、市值三因子为基础的多因子选股模型。
- 使用滚动6个月回归系数平滑预测未来收益率,并基于τ=0.1分位数回归预测值排序。
- 构建等权和市值加权两类投资组合,均证实QR(0.1)组合优于传统OLS组合。
- 该策略提高因子有效性,增强股票预期收益区分度,且交易成本稳健。
深度阅读
报告标题与概览
本报告标题为《选股因子系列研究(二十七)——分位数回归在多因子选股中的应用》,由海通证券研究所冯佳睿等分析师团队撰写,发布时间接近2017年下半年。报告核心关注于在量化选股模型中应用分位数回归(Quantile Regression,QR)方法,特别是通过实证中证500指数成分股,探讨分位数回归相较于传统均值回归(OLS)在多因子选股中的优势与应用路径。
报告的核心论点是:传统均值回归方法对于刻画因子与股票收益均值的关系有效,但无法全面体现各因子对股票收益分布不同分位点的影响,导致信息遗漏。分位数回归作为一种更稳健且灵活的估计方法,能够对收益率的不同分位点建模,揭示因子对整个收益率分布的不同影响,进而提升股票的排序效能和投资组合表现。报告通过对比不同分位点的回归估计,推荐选取斜率绝对值最大(回归直线最陡峭)、统计显著的分位点进行选股实践,以达到收益增强的目标。
报告结论显示,尤其以10%分位数(τ=0.1)的分位数回归选股模型(以下简称QR(0.1))表现最佳,在不论等权还是市值加权的情况下,均显著超越传统均值回归(OLS)的选股效果,且组合风险特征较为平稳,换手率类似,支持实操稳健性。报告同时指出风险提示主要为模型失效和因子失效风险。[page::0,1]
---
深度解读报告各部分内容
1. 分位数回归基本原理
报告首先阐述了分位数回归的基础理论。区别于OLS最小二乘法仅适用于估计因子对收益均值的影响,分位数回归允许研究因子对收益率整体分布不同位置(不同分位点)的影响,解决了证券数据存在非正态、厚尾和异方差问题的局限。其核心回归形式为:
\[
\mathfrak{p}{i}(\tau) = \bar{\alpha}\tau + \bar{\beta}\tau xi + u_i,
\]
其中τ为选定的分位数参数,范围0至1间。回归参数与τ相关,允许因子效应随收益分布位置变化而变化。通过优化目标函数使分位点条件概率被满足,分位数回归为不同权重残差赋值,是一次线性规划问题,而非OLS的二次优化。
分位数回归为多因子选股提供了更全面的信息层面。例如,假设两个股票的均值收益相近,但低分位点收益远高于另一只,分位数回归可辅助选择风险更低的股票。VaR的概念与分位数回归自然结合,10%分位数收益的负值即为10%VaR指标,为风险度量提供理论依据。[page::4,5]
---
2. 分位数回归在单因子选股中的应用:因子效应的分位点差异性分析
报告针对前一个月收益率、日均换手率和总市值三因子,采用中证500成分股月度数据进行单因子分位数回归对比发现:
- 前一个月收益率因子对收益分布的影响存在显著的分位点异质性:
- τ=0.1(低收益分位点)对应的回归斜率比均值回归的两倍还大,表现出较强的负向影响,体现的依旧是反转效应;
- τ=0.9对应斜率甚至转为正,说明对高收益分位点影响方向相反。
图1和图2直观显示分位数回归线与OLS直线的差异,极端分位点的潜在信息被均值回归掩盖。
- 日均换手率因子对收益率分布各分位点影响较为均匀:
不同分位点的斜率围绕均值回归线微幅波动,整体负相关,但强度变化幅度较小。
- 总市值因子影响也存在显著分位差异,在低分位点表现为强烈负相关,高分位点正相关,说明大市值股票收益率分布更分散,低位和高位预测极端,反映小盘股和大盘股效应的差异。
从上可见,三因子对收益率的不同部位产生了完全不同的影响,传统OLS回归的平均效应缺乏对这类复杂关系的捕捉力。[page::5,6]
---
3. 分位点τ的选择及其投资意义
报告指出,由于每个τ值对应不同的预测,实际投资中必须选定最合适的τ来排序股票。原则上应选择使回归斜率最陡且显著的τ。
基于单因子分析,三因子的斜率绝对值均在τ=0.1附近达到峰值,因此在多因子选股模型中采用τ=0.1既反映因子的敏感性最大,也有理论基础支持。
从风险管理角度,τ=0.1预测值的负值对应VaR,投资者选择该分位点预测等同于选择风险更低组合,这一视角为分位数回归的投资意义提供了更为深化的解释,凸显其风险调整选股优势。[page::6,7]
---
4. 三因子多因子分位数回归模型构建与实证分析
4.1 数据与模型设定
- 样本范围:2007年1月至2017年9月,中证500指数全部成分股的月度数据。
- 变量:\( t \)月份因子值解释\( t+1 \)月份收益。
- 异常值剔除采用MAD(中位数绝对偏差法),同时进行行业中性化与Z-score标准化处理。
- 采用6个月移动平均的回归系数定期更新模型,每月末根据模型预测进行排序并构建10个分组组合,通过等权和市值加权分析归集收益。
- 交易成本假设为双边千分之三,起始组合时间为2007年8月。
4.2 回归系数变动特征
- 图7至图10显示不同τ分位数及OLS模型中三因子系数比例变化。
- τ=0.1对应的分位数回归系数时间序列最稳健,变化平缓,有助于基于过去选股规律进行预测。
- τ=0.9系数剧烈波动,暗示高分位点模型预测能力不足。
- 中位数回归τ=0.5与OLS较为接近,但中位数回归更稳健,受异常点影响较小。
4.3 组合收益表现
- 表1展示各分组年化收益率,关注多空组合D1-D10的收益差。
- QR(0.1)在等权和市值加权下均实现最大多空差,且多头D1组合收益显著优于均值回归,多空组合年化收益差分别达到28.83%和27.34%,远超OLS的18.89%、17.42%。
- QR(0.9)表现最差,进而证明高分位因子模型稳定性不足。
4.4 累计净值与相对强弱
- 图11至图14依次展现不同回归方法多头组合累计净值和相对中证500指数的强弱指标。
- 从2011年开始,QR(0.1)的组合明显跑赢OLS及τ=0.5和0.9的模型,展现稳定的绝对和相对收益优势。
- 但2017年起各自未能击败基准指数,表明因子失效风险需要关注。
4.5 分年度收益与风险调整表现
- 图15、16展示11年间按年度分解的QR(0.1)与OLS的多头组合收益,除了2008和2017年极端年份,QR(0.1)表现持续优于OLS。
- 表2和表3的风险收益特征彰显QR(0.1)组合的夏普比率明显优于OLS,波动和最大回撤基本持平。
- 换手率接近,说明使用分位数回归并未带来更多交易成本风险,增强组合收益的提升是实质性的。
综上,QR(0.1)因子组合具备更好的区分能力和收益稳健性,且交易效率未受损害。[page::7,8,9,10,11]
---
图表深度解读
- 图1与图2(前一个月收益率因子回归线及斜率)
图1显示OCR(τ=0.1)回归线斜率陡峭、斜率为负,强化了收益反转的负向关系;OCR(τ=0.9)竟呈正斜率,显示不同收益分位点股表现差异显著。图2进一步用置信区间佐证分位数回归的估计稳定性,极端分位点差异大到置信区间不重叠,反映出均值回归忽视的非对称风险和效应。
- 图3与图4(日均换手率因子)
回归线及斜率变动不大,证实换手率因子的影响较为均匀,未显极端分位异质性。
- 图5与图6(总市值因子)
低分位点斜率为负,高分位点斜率显著正向,说明大市值股票极端回报波动加剧,这在图5收益散点图中亦可见明显差异。
- 图7至图10(多因子回归系数时间序列)
可视化了三个因子随时间权重占比变动,τ=0.1下权重稳定,而τ=0.9大幅波动,说明低收益分位点模型应用更具连续性。
- 表1(分组收益)
展示了10个分组对应的年化收益,有力证明基于τ=0.1模型的组合收益分化最大。
- 图11至图14(累计净值与相对强弱指标)
明确表达了QR(0.1)策略在中长期的领先优势,是基于有效预测模型建立的稳健增值组合。
- 图15、16(分年度收益)及表2、3(风险收益特征)
明确显示QR(0.1)组合在绝大部分年份实现超额收益、波动和夏普比率较OLS更优,且换手率无显著差异,实现了收益与风险的显著提升。
整体图表总结:报告的图表系统完备,用直观的散点图、时序堆积图和收益比较表,充分佐证了分位数回归选股优势和实践应用的有效性,呈现技术与实证数据的有效融合。[page::5,6,8,9,10,11]
---
估值分析
报告无关于传统估值模型的讨论,焦点主要集中于量化选股模型的回归方法对组合绩效的影响,因此无估值技术层面的分析或目标价预测。投资逻辑侧重因子与收益分布的统计关系及选股质量,而非绝对价格水平估值。
---
风险因素评估
报告明确指出两大主要风险:
- 模型失效风险:由于分位数回归放大了因子beta,若市场环境变化或因子结构本身转变,模型输出风险可能扩大,表现不佳。
- 因子失效风险:部分核心因子(如市值、前一个月收益)存在周期性失效期,特别2017年选股表现不佳即得以体现。
报告建议投资者在使用分位数回归模型构造增强组合时,应持续监控因子有效性和模型适用性,同时关注因子风险管理措施。
该风险识别准确且现实,未提供具体缓释措施,体现了量化模型固有的适用环境依赖特性。[page::0,10,11]
---
审慎视角与批判性观点
- 报告全面而严谨,对分位数回归的机制、优劣与应用场景作了系统介绍,实证样本充分,图表解析细致。
- 其展示的实证结果极佳,但可能存在以下审慎思考空间:
- 因子选择限定性:仅基于三因子构建模型,因子扩展对多元市场环境适应性的影响未深入探讨;
- 时间稳健性问题:尤其是2017年开始的因子失效提醒模型对市场结构变迁的调整能力有限,分位数回归放大beta带来的风险或在极端市场条件下表现更不稳定;
- 分位点选择的主观性与实际影响:报告依赖τ=0.1斜率绝对值最大原则,但极端分位点模型可能对异常数据敏感,模型灵敏性未完全量化,实际选取最优τ仍需结合多维度指标;
- 风险提示较为简略,未配合具体的风险管理建议或容错机制,模型失效的潜在代价和对冲手段缺乏深入讨论。
尽管如此,报告整体基于实证数据,推理逻辑清晰,未见重大自相矛盾之处。
---
结论性综合
本报告系统阐释了分位数回归在多因子选股模型中的理论优势与实际应用价值。核心发现包括:
- 分位数回归突破传统均值回归的局限,揭示因子对收益率分布不同分位点的多样化影响。
通过对中证500指数月度数据实证,发现前一个月收益率、市值及换手率三个关键因子在不同收益分位点呈现截然不同的斜率特征,传统OLS无法捕捉此细节。
- 选择斜率绝对值最大且显著的τ=0.1分位点作为多因子模型基准,实现了更有效的股票排序。
该选择建立在理论的VaR风险管理视角之上,既增强了风险调整后的投资收益,也更稳健。
- 实证结果表明QR(0.1)选股策略在2007-2017年间,无论等权或市值加权,多头组合的累计净值和相对中证500强度均显著优于传统OLS,整体年化超额收益提升近10个百分点以上。
同时,风险指标如波动率、最大回撤无明显扩大,换手率类似,说明策略提升非以风险或交易频率增加为代价。
- 图表和数据揭示低分位点分位数回归系数时间序列更稳定,提升了回归模型的持续预测能力,而高分位点回归模型波动剧烈,预测能力可能较差。
- 风险提示明确指出模型和因子潜在失效风险,呼吁投资者持续跟踪市场环境,灵活调整。
总结来看,分位数回归作为OLS的重要补充和替代,能够丰富量化多因子选股模型的信息结构,提升组合绩效,特别适合于捕捉市场因子对收益分布尾部的影响。投资者与量化团队可考虑将该方法融入资产配置和风险管理体系,结合更丰富的因子库和优化算法,推动量化投资研究的发展。
报告立场明确、实证充分,推荐基于τ=0.1的分位数回归多因子选股模型,给予积极关注。
---
参考图片展示
- 图1:前一个月收益率的均值回归与分位数回归直线

- 图2:前一个月收益率不同分位点斜率估计

- 图11:等权重下QR和OLS多头组合累计净值

- 图12:等权重下QR和OLS多头组合相对强弱指数

- 图15:等权重QR(0.1)与OLS年度收益对比

- 图16:市值加权QR(0.1)与OLS年度收益对比

---
综述
本报告提供了一个理论与实证结合的框架,支持分位数回归在量化多因子选股领域广泛应用,特别是在识别和管理尾部风险方面能力突出。它有效重新定义了传统因子的作用与理解方式,为基于收益分布更全面理解因子收益关系打开了新的视角。
尽管存在模型和因子失效风险,报告的深入视角与严谨方法值得业界关注与进一步研究推广。结合更大的因子体系及多元风险管理框架,分位数回归有望成为主动选股、风险控制及资产配置中不可或缺的工具。
[page::0,1,4,5,6,7,8,9,10,11]