`

量化研究新思维(十九)——机构投资者持股拥挤度因子

创建于 更新于

摘要

本文研究了机构投资者持股拥挤度因子,分为被动拥挤和主动拥挤两类,均能够产生显著的正收益和正alpha。被动拥挤度因子主要来源于ETF和指数基金流入,适合作为剔除型风险管理工具;主动拥挤度因子结合基金经理重仓、卖方买入评级、长期动量和机构连续净买入,能够有效筛选低估股票,优化基本面选股策略。两类因子均在不同市值组均展现出稳健的业绩表现,且主动拥挤度因子表现出较强的抗回撤能力[page::4][page::5][page::9][page::11][page::12]。

速读内容


被动拥挤度因子定义与构建 [page::4-5]


  • 根据被动基金持股占比的滚动变化和股票市值划分出被动拥挤、中性和不拥挤股票。

- 做多不拥挤做空拥挤组合在全样本及各市值组均获得正收益,其中小盘股收益最高(10.52%年化)。
  • 最优因子构建和持有期为滚动6个月和1-6个月区间,因子信号强度随持有期增大而减弱。


被动拥挤资金流波动及换手率分析 [page::5-6]



  • 被动资金流差异随回看期增长,长期极端变化显著,但短期差异较小。

- 拥挤组合换手率随持有期拉长大幅降低,说明拥挤特征具有一定持续性。

被动拥挤度因子的回归及选股应用表现 [page::6-8]




  • Fama-French四因子模型回归显示,拥挤度因子产生正alpha(回归系数0.6,t值1.9)。

- 被动不拥挤股票在中盘和小盘表现显著优于中性组。
  • 剔除被动拥挤股票后,各市值组组合年化收益率提升显著,特别是中盘和小盘。


| 市值组 | 全部股票年化收益 | 剔除拥挤股票后年化收益 | 收益提升(bps) |
|-------|------------------|------------------------|---------------|
| 全样本 | 8.32% | 8.46% | 14 |
| 大盘 | 8.09% | 8.17% | 8 |
| 中盘 | 9.78% | 10.28% | 50 |
| 小盘 | 10.23% | 11.01% | 78 |

主动拥挤度因子的构建与回测 [page::8-11]




  • 主动拥挤度因子基于主动基金重仓持股数量、买方卖方情绪、长期动量及机构交易持续期四个子因素合成。

- 不拥挤组合年化收益显著超越拥挤组合,持有期6个月以上表现优异。
  • Fama-French模型回归显示主动拥挤度因子产生显著正alpha,且动量系数为负说明主动拥挤度含对立动量特征。


| 持有期/月 | 1 | 3 | 6 | 9 | 12 |
|----------|------|------|------|------|------|
| 全样本 |1.23% |2.32% |2.45% |2.64% |2.01% |
| 大盘 |0.33% |1.63% |1.76% |2.03% |1.45% |
| 中盘 |0.62% |1.50% |2.43% |2.95% |2.39% |
| 小盘 |4.91% |4.17% |4.32% |4.36% |3.88% |

主动拥挤度因子应用:收益、波动率及风险特征 [page::11]




  • 主动拥挤组合年化收益显著低于中性及主动不拥挤组合,波动率相近,拥挤组合波动率反而略低。

- 拥挤组合存在负偏度,意味着遭遇回撤时跌幅更大。
  • 不拥挤组合表现正偏度,且含有更多被严重低估的股票,盈利逻辑稳健。


研究结论与风险提示 [page::12]

  • 被动拥挤的ETF等被动资金流入股票导致价格短期偏离内在价值,多为高估且未来表现不佳,更适合作为剔除风险因子。

- 主动拥挤股票因基金经理共同行为容易出现估值泡沫,主动拥挤度因子有效提升选股和风控效果。
  • 主动拥挤组合面临更大下行风险,控制其暴露有助降低组合回撤。

- 风险提示:系统性风险、模型失效、国内外市场结构差异。

深度阅读

报告详尽分析报告



---

一、元数据与概览


  • 报告标题:《量化研究新思维(十九)——机构投资者持股拥挤度因子》

- 作者:冯佳睿,海通证券研究所,金融工程研究团队
  • 发布日期:2020年2月21日

- 研究机构:海通证券股份有限公司研究所
  • 主要研究内容和主题:本文聚焦机构投资者持股中的“拥挤度”因子,细分为“被动拥挤”和“主动拥挤”两大类型,研究其对股价表现的影响及投资意涵。被动拥挤多源自指数基金和ETF等被动资金的大规模定向买入,而主动拥挤则源自主动基金经理的情绪和认知趋同性。通过构建相关因子组合,本文系统分析其收益表现、风险特征及实际应用价值。

- 核心论点
- 机构投资者的持股拥挤可以被视为市场情绪和认知分歧的反映。
- 被动拥挤因子多表现为拥挤股票未来的表现较弱,适合作为剔除型因子使用。
- 主动拥挤因子揭示主动基金经理共识较高的股票更倾向于被高估,主动不拥挤股票则包含较多被低估标的。
- 两类拥挤因子均能在剔除传统风险因子后产生显著alpha,具有实际投资和风控价值。
  • 投资评级和目标价:无具体评级和目标价信息,报告更多偏重于量化因子研究和策略构建。


---

二、逐节深度解读



1. 被动拥挤(Passive Crowding)



1.1 定义及样本构建


  • 定义方式

- 股票按市值排名分为大盘(>83%分位)、中盘(66%-83%分位)、小盘(<66%分位)。
- 在每个市值组内,依据被动基金持股占总股本比例6个月滚动变化排序,前10%定义“被动拥挤”,中间80%为“中性”,后10%为“被动不拥挤”。
  • 样本筛选

- 结合成交量和市值筛除流动性差、规模小股票,确保数据的代表性和头寸可建立性(成交量日均最低约230万美元,市值最低约3.5亿美元)。
- 涉及股票类别广泛,包括普通股票、REITs和MLPs。
  • 推理依据

- 被动资金流动大多由资金流入流出驱动,缺乏对个股基本面的判断,可能导致价格偏离合理价值,形成系统性定价误差。
- 这种拥挤交易行为可能降低市场效率,形成可套利的alpha机会。

1.2 组合业绩表现


  • 通过不同回看期(1-12个月)构建被动拥挤度因子组合,并测试后续1至12个月持有期的表现,发现:

- 做多被动不拥挤的股票,做空被动拥挤的股票的策略整体正收益。
- 各市值组别中,小盘组收益最高(10.52%年化),其次为中盘(4.25%),大盘最低(1.92%),说明小市值股票的被动拥挤现象带来更明显的负面溢价。
- 最优绩效出现在使用3-9个月持股变化回看期构建因子,回测1-6个月持有期合理,1个月持有期易于复现和实际实施。
  • 经济学逻辑支持

- 最近几个月的资金流指标能更有效反映主动套利空间,因为极端流动变化在短期难现且被快速矫正。
  • 换手率

- 图3显示换手率随持有期延长明显降低,意味着被动拥挤状态较快变化,拥挤概念快速更新。

1.3 被动拥挤度因子统计特征及应用


  • 与Fama-French四因子模型回归结果显示,拥挤因子产生显著正alpha(图4、图5),表明其收益无法被经典风险因子完全解释。

- 在实际应用中,被动拥挤因子更适合剔除或风险管理,而非直接构建多头组合。被动不拥挤和中性组收益差值较小,表现稳定但潜在套利较有限。
  • 资金流入被动基金规模及持股比例历史均稳步上升(见图7),短期内流动较为平稳,系统风险中性。若未来被动资金流呈负转,拥挤股票面临较大调整风险。

- 表1数据强调剔除被动拥挤股票后组合收益提升显著,尤其在中、小盘中,表明这类股票拖累组合收益。
  • 结论是:被动拥挤度是有效的风险剔除工具,需在组合构建层面系统应用。


1.4 小结


  • 被动拥挤度因子是对传统量化选股框架的有效补充。

- 基于被动资金流的拥挤度能预测未来短中期内股票表现弱势,具有投资指导意义。
  • 其有效性在被动基金持续增长的市场环境中更为显著。


---

2. 主动拥挤(Active Crowding)



2.1 主动拥挤定义


  • 主动拥挤度不同于被动资金流,其基于主动基金经理共识及卖方分析师评级,反映积极情绪。

- 四个子因子构成:
1. 主动基金经理重仓持有:统计基金经理持有权重的排名与数量,重仓股数量越多,拥挤度越高。
2. 卖方买入评级占比:股票至少有5位分析师评级,买入评价比例越高,拥挤度越高。
3. 长期动量:两年累计收益表现,高动量代表拥挤情绪。
4. 机构交易持续期:统计机构投资者季度持股变动中净买入/卖出连续期数,持续净买入者更拥挤。
  • 定义拥挤股票为四因子得分均较高的股票,非拥挤股票则各项得分低。


2.2 主动拥挤度因子构建及回测结果


  • 采用与被动拥挤因子类似的市值分组方法,股票等分10组进行打分,综合得分后归为主动拥挤、中性和主动不拥挤三组。

- 回测期:1999年12月至2018年12月。
  • 回测收益:主动不拥挤组合显著优于主动拥挤组合,差值随持有期增长表现更明显,小盘股表现尤佳,12个月持有期差异达4%以上(表2)。

- 单个子因子表现差异较大,尤其基金经理重仓和机构交易持续期因子贡献有限,但综合因子表现稳定好于单因子,符合多因子模型的逻辑。
  • 换手率(图10)表明组合成分约85%在6个月内发生变动,强调6个月持有期的合理性。

- Fama-French模型回归(图12、13)再次证实主动拥挤因子产生显著alpha,且部分回归系数变化符合拥挤股票估值特征(价值因子正收益,动量因子负beta)。

2.3 主动拥挤度因子的应用


  • 主动不拥挤组合年化收益高于其他组别(图14),波动率适中,且表现出正偏度(图15)和较高峰度(图16),意味着包含大量被低估股票,收益分布有利于投资者。

- 主动拥挤组合负偏态明显,表明其更容易遭遇系统性和非系统性风险,尤其回撤风险较大。
  • 投资者可利用主动拥挤度因子辅助选股,避开高风险的拥挤股票,提升组合质量和回撤控制能力。


2.4 小结


  • 主动拥挤因子是有效的选股和风控工具。

- 主动不拥挤股票蕴含显著Alpha,适合中长期持有。
  • 控制对主动拥挤股票的敞口,有助于降低组合下行风险。


---

3. 总结


  • 被动拥挤股票源自指数型和ETF资金流入,预示未来表现不佳。

- 被动拥挤度因子虽有显著alpha,但主要来自拥挤股票负表现,适合用作剔除型风险因子。
  • 主动拥挤股票具有主动基金和分析师的共识情绪驱动,更易高估,主动不拥挤组合业绩优异。

- 两类拥挤度因子均不可简单被经典风险因子解释,具有实际构建多空组合、控制风险的潜力。
  • 推荐视拥挤因子为量化投资中重要的补充工具,同时结合持仓管理优化组合表现。


4. 风险提示


  • 市场系统性风险可能影响因子表现。

- 模型存在失效风险,数据和方法更新需持续验证。
  • 海外与国内市场结构存在差异,研究结果的跨市场适用性有待进一步检验。


---

三、图表深度解读



图1:被动拥挤度因子收益表现(2008-2018)


  • 呈现全样本及按市值分组的年化超额收益。

- 小盘股票组合最高,达10.52%,全样本组合仍有显著正收益(2.98%)。
  • 支撑作多不拥挤,做空拥挤股票策略的有效性。


图1

图2:被动资金流标准差随回看期增长(2008-2018)


  • 标准差由150bps升至逾210bps,表明被动资金流的截面差异随回看期增长显著增强。

- 说明较长回看期聚合了更多极端资金流,短回看期资金流较平稳。

图2

图3:被动拥挤组合预期换手率(2008-2018)


  • 换手率随回看期延长快速下降,从近60%跌至不足5%。

- 表明拥挤股票组合的构成在1-3个月内变化显著,6个月后趋于稳定。

图3

图4-5:被动拥挤度因子Fama-French回归结果


  • Alpha系数0.6,T值1.9,正收益显著但统计力度有限。

- 市场、规模因子负相关,HML正相关。
  • 表明该因子有独立于传统风险因子的表现。


图4
图5

图6-9:被动拥挤与持股变化分析


  • 图6显示被动不拥挤组合优于中性组合,特别在中小盘中更显著。

- 图7-9展示被动基金持股规模及持股变化的稳定增长,持股变化多为正向波动,组合流动性高。
  • 综合指示被动拥挤因子主要产生于拥挤股票表现拖累整体业绩。


图6
图7
图8
图9

表1:剔除被动拥挤股票后组合收益提升(2008-2018)



| 市值组别 | 全部股票收益 | 剔除拥挤股票后 | 收益差(bps) |
| -------- | ------------ | -------------- | ------------- |
| 全样本 | 8.32% | 8.46% | +14 |
| 大盘 | 8.09% | 8.17% | +8 |
| 中盘 | 9.78% | 10.28% | +50 |
| 小盘 | 10.23% | 11.01% | +78 |

剔除被动拥挤股票增加收益,尤其在中小盘较为明显。

图10-13:主动拥挤度因子换手率与收益回归


  • 换手率随持有期延长快速上升,6个月超80%,强调持有期设置的重要性。

- 主动拥挤度因子市值分组年化收益范围从1.6%-4.1%,小盘组合收益最佳。
  • Fama-French回归显示显著正Alpha,部分因子负系数符合动量的对立关系。


图10
图11
图12
图13

图14-16:主动拥挤度组合收益及偏度峰度分析


  • 不拥挤组合收益明显领先拥挤和中性组合。

- 拥挤组合波动较低但负偏态严重,说明面临较大下行风险。
  • 不拥挤组合表现出正偏度、高峰度,意味着收益中存在大量“被低估”股票的强劲反弹机会。


图14
图15
图16

---

四、估值分析



报告未采用传统估值模型(如DCF、市盈率、EV/EBITDA等)进行目标价估算,主要聚焦于量化因子的统计检验与收益表现。从技术上看:
  • 因子收益通过构建多空组合(如多头被动不拥挤股票,空头被动拥挤股票)实现收益捕捉,间接反映其对价值估算的提示。

- 运用Fama-French四因子模型回归分解因子收益,确定alpha是否独立于常见风险因子。
  • 因子多空组合收益体现估值溢价或折价的动态演变,未直接定价股票本身估值。


---

五、风险因素评估



报告披露三大主要风险:
  1. 市场系统性风险:整体市场波动可能掩盖因子信号,影响拥挤度因子表现的稳定性。

2. 模型失效风险:基于历史数据与量化模型的参数设定具有一定时效性,未来市场环境变化可能导致因子失效。
  1. 海外与国内市场结构差异风险:当前研究基于美国市场数据,国内市场制度及参与者结构差异较大,因子跨市场的应用需谨慎验证。


报告未详细提出缓解风险的具体策略,但隐含建议通过组合管理及多因子结合降低模型单一风险。

---

六、批判性视角与细微差别


  • 报告的优势

- 科学严谨地定义拥挤度因子,区分被动和主动拥挤,细化因子维度。
- 数据覆盖时间长,方法论扎实,结合经典Fama-French模型验证。
- 同时兼顾了统计显著性和经济逻辑,具备较强实用性。
  • 潜在局限性

- 被动拥挤因子回归的t值略低(1.9),未来需关注其持续有效性。
- 主动拥挤中部分子因子贡献薄弱,综合因子虽稳定,但如何动态权重配置值得进一步探讨。
- 风险提示部分较为简略,对模型失效与流动性风险的深入分析有限。
- 报告基于美股数据,国内外市场差异较大,相关因子需要本土化验证。
  • 细微之处

- 被动和主动拥挤因子的因果关系较为隐晦,对拥挤度变化的来源及机制尚未完全展开,可能影响策略实施复杂度。
- 拥挤度因子本质上体现市场行为异象,投资者需结合基本面和风控对冲。

---

七、结论性综合



本报告通过系统量化分析,首次将机构投资者持股行为中的拥挤度划分为被动拥挤和主动拥挤两类核心因子,挖掘其对股票未来表现的预判能力。从数据实证来看:
  • 被动拥挤因子基于被动基金资金流入流出的持股变化,展现了拥挤股票未来表现持续弱于非拥挤股票的特征,尤其在小盘股中效果显著。其正Alpha主要来源于拥挤股票表现疲软,故适合以剔除型风险指标形式辅助组合管理。被动拥挤因子的构建和检验过程合理,具备较强现实意义。
  • 主动拥挤因子综合主动基金经理持仓、卖方评级、长期动量和机构净买入的情绪指标,能够有效识别被高估的拥挤股票。主动不拥挤股票不仅收益显著优于拥挤股票,还表现出积极的偏度和高峰度,说明其潜在的价值挖掘空间。结合Fama-French因子回归显示,主动拥挤因子无法被传统风险因子解释,是有效且稳定的alpha来源。
  • 两类拥挤度因子均体现了机构投资者情绪对市场价格的显著影响,为量化投资者提供了重要的因子工具,能够提升选股精度和风险控制能力。特别是在被动投资快速增长及主动基金情绪集中的背景下,拥挤因子的实际应用价值日益凸显。


最终,报告强调拥挤度因子应与传统因子结合应用,系统地管理持仓暴露及风险,避免过度依赖单一因子,从而提升投资组合的稳定性和超额收益。

---

参考文献


  • 海通证券研究所,《量化研究新思维(十九)——机构投资者持股拥挤度因子》,2020年2月21日。[page::0,1,2,4-12]


---

全文分析至此,涵盖报告全部核心内容、数据图表详细解读,重点突出拥挤度因子的定义逻辑、实证分析与投资应用,对因子收益来源和风险提示做了全面剖析,体现了报告的科学性和实战价值。

报告