`

股东户数因子的深挖和改进 | 开源金工

创建于 更新于

摘要

本文深入研究了股东户数因子的选股能力,发现原始因子表现不稳定但回归股本与股价后,负向选股能力显著增强。此外,股东户数季度变化率因子随股价振幅增大表现更佳,并基于“因子切割论”设计精选和标准化因子,显著提升因子稳定性和多空收益的波动控制,为A股市场量化择时提供新的alpha来源 [page::0][page::1][page::4][page::5].

速读内容

  • 股东户数(HN)因子与流通市值高度正相关(均值约0.55),但原始HN因子的RankIC约为-1.97%,表现不稳定且负向明显,市值中性化后表现无明显改善。



- 股东户数与流通股本相关性更强(均值0.76),与股价负相关(均值-0.50),表明股东户数受股本和股价的截然不同影响。[page::1][page::2]
  • 通过对股本和股价分别或联合回归剔除影响后,得到的残差因子(HNshareind、HNpriceind、HNsharepriceind)表现更优,显著提升RankIC及稳定性;其中HNpriceind因子表现最突出,年化多空收益高达16.1%,且分组收益单调性最佳。



[page::2][page::3]
  • 构造近期两期财报间股东户数季度变化率因子HNpct及其绝对值abs(HNpct),均展现一定负向选股能力,HNpct因子RankIC为-2.02%,年化多空收益5.55%。





[page::3][page::4]
  • 通过计算每只股票过去8个季度的股价振幅并对相应的HNpct、abs(HNpct)因子进行排序后发现,区间股价振幅越高的季度对应的因子表现越好,最高振幅组的RankIC分别达到-2.64%和-2.39%。



[page::4]
  • 基于“因子切割论”思想,设计了精选(top4/top6)和标准化(diff4/diff6)因子构建方法,精选因子在RankIC、多空收益和多头收益保持稳定的同时显著提升因子稳定性和多空收益波动比,多空最大回撤亦有改善;标准化因子的因子稳定性更优,但部分收益指标有所下降。

| 因子名称 | RankIC | RankICIR | 多空收益 | 多空收益波动比 | 多空收益最大回撤 | 多头收益 |
|----------------|----------|----------|----------|---------------|-----------------|----------|
| HNpct
top4 | -3.85% | -1.86 | 11.86% | 1.70 | 6.02% | 13.67% |
| HNpctdiff4 | -2.79% | -1.89 | 8.77% | 1.76 | 4.20% | 11.91% |
| abs
HNpct_diff6| -2.98% | -2.04 | 9.08% | 1.80 | 4.65% | 11.37% |

[page::5]

深度阅读

报告详尽分析:《股东户数因子的深挖和改进》——开源金工,2023年6月18日



---

一、元数据与概览


  • 报告标题:《股东户数因子的深挖和改进》

- 作者及团队:开源证券金融工程团队,首席分析师魏建榕领衔,团队成员包括苏俊豪等
  • 发布日期:2023年6月18日

- 研究领域与主题:基于A股市场的股东户数数据,构造并挖掘股东户数相关选股因子的表现,评估因子回归股本与股价后的表现差异,并考察股价区间振幅对股东户数变化率因子选股能力的影响。
  • 报告核心论点

1. 股东户数因子(HN)原始表现不稳定,但经过回归剔除股本和股价后,稳定性及显著性有明显提升。
2. 股东户数的变化率因子的负向选股能力受到区间股价振幅的影响,振幅越大,相关因子表现越优。
3. 基于因子切割论,构造精选和标准化的股东户数变化率因子,有助于提升因子表现的稳定性和收益回撤特征。

报告旨在通过深入分析股东户数的多维度影响及改造,实现更有效的市场alpha挖掘。

---

二、逐节深度解读



1. 报告摘要及引言


  • 关键论点

- 股东户数因子(HN)初始RankIC为-1.97%,说明股东户数越多,预期收益越低,但因子稳定性差。
- 股东户数在A股体现个人投资者关注度,是独特的alpha来源。
- 股东户数与流通市值正相关,高达0.55秩相关系数,但股东户数与流通股本和股价的关系呈现明显的正负反转效应。
- 采用股本、股价分别回归剔除,得到的因子残差在统计显著性和稳定性上更优。
- 股东户数季度变化率(HNpct)与其绝对值(abs(HNpct))同样表现出一定的负向选股能力,且二者效能在高股价振幅股票中更佳。
  • 推理基础

- 采用向后填充、月度抽样构造因子。
- 分析股东户数与市值、股本、股价三者间的截面相关性。
- 结合中性化处理和回归剔除方法,评估因子作用。
- 通过RankIC、RankICIR、RankIC胜率、多空收益等多指标衡量选股效果。

这一节奠定了研究框架 [page::0][page::1].

2. 股东户数因子的截面相关性及回归改进


  • 关键数据点

- 股东户数与流通市值秩相关均值0.55(图1),说明二者强正相关。
- 分拆市值为股本与股价后,流通股本与股东户数正相关程度提升至0.76,而股价与股东户数呈明显负相关(-0.50)(图3)。
- 因为股东户数受股本规模(持股总“份额”)正面影响,而股价(作为投资门槛)则负相关,如图4所演示的逻辑框架。
  • 回归与中性化实验(表1、图5):

- 单纯市值与行业中性化的HN因子RankIC为-1.48%,不及原始因子表现。
- 依次回归剔除股本、股价、或两者联合后,RankIC提升至约-3.67%~ -3.87%。
- 联合回归股本、股价和行业中性化后,RankIC达到-3.86%,RankICIR显著提升至-2.12,稳定性得到改善。
  • 分组收益表现(图6):

- 在残差因子中,回归剔除股价后的HNpriceind因子的多空收益最强,年化多空收益达16.1%,且分组收益曲线单调,代表良好的选股判别能力。

作者由此推断,直接使用原始股东户数因子因其与市值成分混杂而表现不稳定,需分别剔除股本与股价的影响以获得更纯粹的alpha信号,股价因素的剔除尤为关键 [page::1][page::2][page::3].

3. 股东户数变化率因子与股价振幅的关系


  • 股东户数变化率HNpct统计指标(图7、图8):

- HNpct的RankIC约为-2.02%,RankICIR为-1.28,RankIC胜率63%,表现负向选股能力。
- 多空收益达5.55%,但多头端效果不明显,空头端负收益显著。
  • 绝对变化率abs(HNpct)(图9、图10):

- 绝对变化率RankIC为-2.15%,RankICIR为-0.98,年化多空收益4.37%,但波动率较大,稳定性相对欠佳。
  • 结合股价区间振幅的分析

- 通过获取多个季度股价振幅和对应的HNpct/abs(HNpct)数值,对因子进行基于振幅的“切割”排序(表2、表3)。
- 振幅越大,HNpct与abs(HNpct)因子表现越好,最高振幅组的RankIC分别为-2.64%、 -2.39%(图11、图12)。

可见,股东户数的变化率因子在股价波动剧烈的股票上选股能力较优,或反映了个人投资者在大幅波动期间的拥挤行为或者情绪反应更明显。

4. 基于因子切割论的因子再构造


  • 精选因子与标准化因子构造思路

- 按照股价振幅对因子进行排序,将表现较好的高振幅季报因子取平均(如top4、top6)。
- 同时构造振幅两端差分因子(diff),即高振幅因子减低振幅因子,以提高选股差异性和稳定性。
- 对照因子为全部八个季度数据的均值因子。
  • 表现对比(表5):

- 精选的HNpcttop和absHNpct_top因子在RankIC、多空收益、多头收益方面与均值基准变化不大,但RankICIR(稳定性)、多空收益波动比和最大回撤表现明显改善。
- 标准化因子(diff)的收益有所下降,但稳定性指标及指标波动均获加强,体现因子风险控制能力提升。

该策略提升了股东户数变化率因子的实用性,特别是因子的稳定性和回撤控制,为量化投资实战提供了更稳健的工具。

---

三、图表深度解读


  • 图1(股东户数与流通市值相关系数)

图示2014年12月至2023年3月间股东户数与流通市值的秩相关系数呈现0.4-0.65区间波动,平均0.55左右,显示二者伴随变化趋势较强(非偶然) [page::1]。
  • 图2(HN因子回归市值及行业中性化前后表现)

蓝线(原始因子)与红线(市值行业中性化后)累积RankIC序列均为负值且走势持续下行。说明简单市值行业中性化未能带来因子性能提升,表现稳定性依旧不足 [page::1]。
  • 图3与图4(股本与股价与股东户数的相关性分析)

股本与股东户数的正相关度提升至0.76,股价则为-0.5负相关(图3)。图4框图展示股本增加增加持股份额对应股东户数上升,股价上涨则提升投资门槛导致股东数量减少,两者对股东户数影响方向相反 [page::2]。
  • 表1与图5(不同中性化处理后的HN因子表现)

表1列明原始因子RankIC为-1.97%,市值行业中性化后略上升至-1.48%;剔除股本或股价的中性化因子能显著提高负向选股信号(-3.67%~ -3.87%);联合剔除达到最佳(-3.86%)。图5累积RankIC图表现该趋势,残差因子明显优于原始因子,稳定性提升也较显著 [page::2]。
  • 图6(分组收益表现)

不同残差因子多空收益分组条形图显示,回归剔除股价中性化的因子(红色柱)拥有最高多空收益率,且组间收益呈现良好的单调递减关系,表明因子信号清晰且择时效应良好 [page::3]。
  • 图7和图8(HNpct因子表现与收益曲线)

HNpct因子RankIC时常显著为负(图7蓝色条长时间处负值区),累计RankIC(红线)也持续下滑。收益曲线图(图8)显示空头组在整体收益中表现更为显著,确认了负向选股信号 [page::3]。
  • 图9和图10(绝对变化率因子abs(HNpct)表现)

similarly,abs(HNpct)呈现较弱但有效的负向选股信号,且收益稳定性波动较大,说明幅度的任何大幅度变化均带来风险 [page::4]。
  • 图11与图12(基于股价振幅进行分组的因子表现)

两图均清晰显示RankIC和RankICIR随股价振幅提升而增强,最高振幅组相关性达到约-2.4%至-2.6%,表明该因子在高波动股票中有更强的预测能力 [page::4]。

---

四、估值分析



本报告聚焦于量化因子性能及构造改进,未涉及直接估值模型或目标价格的计算,因此无传统DCF、P/E等估值分析内容。

---

五、风险因素评估


  • 历史数据依赖风险:模型完全基于历史行情与股东户数数据,未来市场结构、监管、投资者行为发生剧烈变化将影响因子有效性。报告明示“市场未来可能发生重大改变”风险提示 [page::5]。

- 市场环境变化:A股个人投资者行为可能随政策、宏观环境等大幅转变,因子稳定性可能下滑。
  • 因子稳定性风险:原始股东户数因子稳定性较差,虽通过回归剔除改进但仍存波动风险。

- 数据质量及频率限制:股东户数为财报披露数据,频率较低,可能滞后于市场快速变化。

报告未详细提供风险缓解策略,但通过多维度中性化和因子切割方法,部分弱化了上述风险对整体策略的冲击。

---

六、批判性视角与细微差别


  • 因子负向表现的解读需谨慎:HN因子及相关变化率均呈负向RankIC,说明股东户数多是一种拥挤效应或投资者行为过热信号,但其预测未来收益的因果机制可能较复杂,多数解释仅停留在统计相关层面。

- 对股价与股本的拆分尝试,是本报告的亮点,但报告中对于为何股价剔除后表现最佳的经济学机理讨论相对简单,未深入探讨市场参与者结构、限价效应等更深层次因素。
  • 因子切割论的运用体现了对因子不同市场状态表现的敏感性认知,但长期稳定性仍需更多时间段和不同市场环境的检验。

- 部分图表RankIC数值较小(约-2%~ -4%),对实际交易策略的边际贡献存在潜在限制,因子净效应或许需结合其他因子组合使用。

---

七、结论性综合



本报告通过系统分析A股市场中“股东户数”这一独特指标,挖掘和改进了其作为选股因子的表现逻辑和效果。报告验证了:
  • 原始股东户数因子具备负向选股能力,但稳定性不足。

- 股东户数与流通市值高度正相关,但其拆解组成:流通股本与股东户数呈高度正相关,而股价与股东户数则高度负相关,提示应分开剔除这两者影响以优化因子表现。
  • 经过回归剔除股本和股价影响后的股东户数因子,相关性指标(RankIC及RankICIR)、收益表现显著提升,特别是剔除股价后的残差因子表现尤为优异。

- 股东户数季度变化率因子及绝对变化率因子展现稳定的负向选股信号,且其表现受区间股价振幅影响显著,振幅越大,因子效应越强。
  • 采用“因子切割论”构造基于振幅分组的精选与标准化因子,在提升因子稳定性、多空收益波动比及回撤控制能力方面效果显著。

- 尽管表现优异,但各因子依然表现为负RankIC性质,且整体幅度较小,提示实操中应结合其他策略共同使用,并持续关注市场结构性变化带来的风险。

报告的多张图表如图1-图12系统展现了股东户数因子的相关性、因子表现和切割后的效果。尤其是图5与图6清晰说明回归剔除策略的有效性,图11与图12则量化了价格振幅对因子表现的增强作用。

整体而言,报告提供了一个严谨的数据实证框架和方法学改良路径,为A股市场基于个人投资者行为的量化因子研究提供了重要借鉴。

---

参考溯源


  • 原始股东户数因子RankIC及稳定性数据详见摘要及章节1-2部分,[page::0][page::1][page::2]

- 股本与股价相关性及中性化方案效果详见章节2,表1,图3-6,[page::1][page::2][page::3]
  • 股东户数变化率因子及绝对值因子详细表现与图示见章节3,图7-10,[page::3][page::4]

- 股价振幅影响分析及基于振幅切割的因子构造见章节4,表2-3,图11-12,[page::4][page::5]
  • 因子表现总结表见表5,[page::5]

- 风险提示见章节5,[page::5]

---

本分析在尊重报告原文的基础上,系统揭示了股东户数因子的研究逻辑、数据支撑与方法创新,力求为投资专业人士提供详实且透彻的理解。

报告