`

选股因子系列研究(七十四)——基于风格特征的股票重新分类及应用

创建于 更新于

摘要

本报告基于个股风格特征(市值、估值、盈利、关注度)利用K-means方法对股票进行重新归类,发现在因子中实现类别中性化较传统行业中性化能显著提升因子的稳定性和信息比,进而提升指数增强策略的超额收益表现与收益回撤比。同时揭示了A股市场存在显著的风格动量溢出效应,该效应与行业动量溢出效应相对独立,叠加应用效果更佳,为多因子模型构建及风险控制提供了新的思路与方法[page::0][page::4][page::8][page::11][page::13][page::10].

速读内容


基于风格特征的股票重新分类方法与结果 [page::4]

  • 利用个股市场和基本面特征中市值、估值、盈利、关注度四因子,通过K-means聚类算法,按照中信一级行业数设定30类进行股票重新分类。

- 分类结果显示风格类别与传统行业分类相似度较低,平均相似度仅约17.8%,行业分布更为分散。
  • 五种风格因子组合之间分类稳定性较高,相邻两期平均重合度在30%-40%区间,具备较强的时间稳定性。




类别中性化提升多因子模型选股效能 [page::6][page::7][page::8][page::9]

  • 风格类别中性化进一步正交行业影响,提升了风格类、技术类、基本面因子的ICIR和信息比,减少因子收益率波动。

- 类别中性化的市值平方因子表现优于直接正交,表现为更高的ICIR与多空收益信息比。
  • 类别中性化复合因子(技术、基本面、市值平方)月均IC提升,分组收益更加对称,多空收益IR显著超越行业中性化。

- 类别中性化多因子Top100等权组合2013-2021年年化收益33.9%,优于中证500指数及行业中性版本组合。



| 年份 | 中证500指数 | 类别中性化Top100组合 | 行业中性化Top100组合 |
|-------|-------------|-----------------------|-----------------------|
| 2013 | 16.9% | 54.6% | 32.8% |
| 2014 | 39.0% | 80.5% | 44.5% |
| 2015 | 43.1% | 193.6% | 105.9% |
| 2016 | -17.8% | 15.7% | 11.3% |
| 2017 | -0.2% | -19.4% | -2.8% |
| 2018 | -33.3% | -16.1% | -22.3% |
| 2019 | 26.4% | 40.9% | 49.0% |
| 2020 | 20.9% | 20.0% | 34.5% |
| 2021 | 10.3% | 21.2% | 9.3% |
| 全区间| 9.0% | 33.9% | 25.2% |

风格类别中性化的指数增强组合表现及风险控制 [page::9][page::10]

  • 在沪深300指数组合优化中,类别中性化组合相比行业中性组合提升超额收益、信息比及收益回撤比,且保持类似跟踪误差。

- 行业分化度越低时,类别中性化组合的超额收益优势越明显;行业风格对比的分化度差异显著影响两组合表现。



风格分类动量溢出效应独立于行业动量溢出效应 [page::11][page::12]

  • 基本面相似或关联公司股价存在动量溢出效应,行业动量表现显著,周频和月频均获得正向多空收益及信息比。

- 风格分类动量因子同样表现出显著的动量溢出,多空收益正面且统计显著,月频表现弱于行业动量。
  • 两种动量因子时间序列相关较低,具备互补性。在横截面多因子回归中,风格动量与行业动量溢价均显著且相对独立。






结论与风险提示 [page::13]

  • 风格特征重分类并类别中性化改善选股因子的有效性及指数增强策略表现,实现超额收益提升且风险控制更优。

- 风格动量溢出效应为市场新发掘的动量模式,与行业动量溢出效应相互独立互补。
  • 关注模型误设及历史统计规律失效风险,投资需注意动态调整策略适应市场变化。

深度阅读

报告详尽分析 — 基于风格特征的股票重新分类及应用研究



---

1. 元数据与报告概览



标题:选股因子系列研究(七十四)——基于风格特征的股票重新分类及应用
作者及分析师:冯佳睿,罗蕾(海通证券研究所金融工程研究团队)
发布日期:2021年11月
发布机构:海通证券股份有限公司研究所
研究主题:利用个股的风格特征(市值、估值、盈利、关注度)对中国A股股票进行基于机器学习K-means聚类方法的重新分类,进而探讨风格分类在多因子选股模型、风险控制及动量溢出效应中的应用与价值。

核心论点总结
  • 行业分类作为传统标准虽广泛应用,但其同类股票未必在基本面及风格特征上真正相似。

- 基于市值、估值、盈利和关注度四大风格变量使用K-means分类,形成的风格类集合与行业分类一致性较低,提供了新的股票群体划分视角。
  • 风格分类结合类别中性化处理,可提高多因子模型的稳定性和因子信息比(ICIR),增强预测能力和组合表现。

- 风格分类存在显著的动量溢出效应,且与行业动量效应相对独立,两者并用进一步提高超额收益。
  • 风格类别中性相较于行业中性,在风险控制和指数增强策略中表现出更优的超额收益和风险调整表现。

- 研究同时提示模型误设和历史规律失效风险。

整体,报告力图推广风格因子的分类应用,突破传统行业划分限制,赋能多因子投资框架,提升选股和风险控制的效果。[page::0,4,8,11,13]

---

2. 章节细节深入解读



2.1 基于风格特征的股票重新分类



关键论点
  • 行业分类以主营业务区分,未必保证基本面与风格一致性。

- 报告选取市值、估值、盈利、关注度四类风格变量做为主要特征,频率匹配盈利数据(每年3次更新)。
  • 应用K-means算法(K=30,参照中信一级行业数量,且初始质心用行业均值确定)进行聚类,确保分类的相对稳定性。

- 统计分类与行业分类的重叠度,发现平均相似度仅约17.8%,显示风格分类中的行业分布较分散,风格与行业分类匹配度不高。
  • 同时,五种不同变量组合的分类结果彼此相似度较高(约51%至90%),验证了风格分类的内部一致性。

- 分类稳定性通过相邻期股票成分重叠度度量,稳定在30%-40%,具备合理连续性。

数据说明及分析
  • 表格(图1)展示30类风格分类中个股数量及对应最相似的前三个行业及相似度,绝大多数类别与单一行业集中度不足30%,证明风格划分与行业分类存在较大差异。

- 图2和图3展示不同风格变量组合的风格分类与行业分类的平均和最大相似度时间序列,均呈现稳定且较低水平,说明风格分类为行业分类的有效补充。
  • 图4表明不同风格变量构成的分类间相似度较高,说明这些变量组合产生的分类结果具有内在一致性。

- 图5和图6则揭示分类结果的延续性,中期股票归属具有连续性强化了风格分类的可用性。

本节论证清晰,支撑了风格特征可作为股票分类标准,有别于传统行业特征,为后续建模提供基础。[page::4,5,6]

---

2.2 风格分类在多因子模型上的应用



关键论点
  • 因子选股效果受行业影响较大,因此通常应用行业中性化处理提升稳定性,本文引入风格类别中性化作为补充。

- 风格类别中性化定义:将同一风格类别的股票归为一类进行中性化,区别于单独对每个股票因子做正交处理。
  • 类别中性化在风格类因子(市值、市值平方、估值)、技术因子(反转、换手率、换手率波动率)和基本面因子(ROE,SUE)中广泛应用,均显著提高因子信息比(ICIR),降低波动率,增强选股收益的稳定性和效率。


数据与模型解读
  • 表1-3分别展示风格类、技术类和基本面因子在原始、行业中性和类别中性三种处理下的IC表现和多空收益。可见类别中性在提升ICIR方面效果明显。

- 图7和图8对比了市值平方因子通过直接正交和类别中性化的性能差异,显示类别中性化优于直接正交的ICIR和多空收益IR说明类别中性化更适合实际因子处理。
  • 表4至表6展示了类别中性化复合因子在IC、年化波动率和ICIR等指标上的优越表现,同时2013年至2021年构建的类别中性化因子top100组合年化收益为33.9%,显著超越中证500及行业中性top100组合。

- 组合风险控制中引入类别中性化后,沪深300增强组合收益和信息比均优于行业中性化组合,且收益波动率与最大回撤有所降低,说明类别中性化有助于降低风险并提升超额收益(见表7)。
  • 不同年份表现差异主要源于市场风格与行业强度不同时的适用性。2017、2019-2020年行业分化度高时,行业中性策略表现优于类别中性策略,这种差异与两者对市值风格暴露差异有关。


本节深刻揭示类别中性化作为风格聚类后的一种因子处理方法,能够有效增强因子稳定性和多因子组合表现,兼顾超额收益和风险控制,丰富了多因子模型的设计思路。[page::6,7,8,9,10]

---

2.3 风格分类的动量溢出效应



关键论点
  • 动量溢出效应是指基本面相似或关联企业股价之间存在领先-滞后关系,行业动量是传统例证。

- 报告依据三级行业划分,剔除市值及行为因子,验证了行业动量因子选股效果显著,无论周频还是月频,高动量组合收益明显优于低动量组合(表8,图11、12)。
  • 相同方法下,市值、估值、盈利这些风格分类也展现明显动量溢出效应(表9,图13-16),高风格动量组合表现优于低动量组合,且溢价统计显著。

- 对比行业动量与风格动量净值曲线显示两者间相关性较低,存在互补性。
  • 通过多因子截面回归,控制多种常规因子和行业虚拟变量,发现行业动量与风格动量均独立贡献显著正溢价(表10),说明风格动量作为独立的动量来源价值明显。


图表解读
  • 表8、9的详细收益、胜率、信息比均证明动量效应存在统计学意义。

- 图14和图16展示了周度和月度多空净值,均呈现稳健上涨趋势,标志着动量策略的良好市场表现。
  • 图9、图10结合其它章节内容,分析了行业分化度与相对收益的关系,进一步支持了本段结论。


本节充分证明风格分类不仅是静态特征划分工具,也能捕捉市场价格动量传导的动态效应,且其动量溢出效应与行业动量效应独立存在,拓宽了动量投资理论及实务操作维度。[page::11,12,13]

---

3. 图表深度解读


  • 图1(2021.10风格分类与行业相似度)

通过呈现30个风格类别中个股数量与行业相似性比率,突出风格类别的行业分布低集中度,点明风格分类与行业分类存在结构性差异。
  • 图2、图3(风格分类与行业分类的相似度时间序列)

多年数据展示不同风格变量组合分类与行业分类平均及最大相似度持续保持相对稳定且较低的状态,强化风格分类的独立性和差异。
  • 图4(不同风格变量组合内的分类相似性)

高中度相关性说明不同组合方案的分类在本质上趋于一致,保证研究范式和因子选择的有效性。
  • 图5、图6(分类稳定性)

相邻期分类重合度在30%-40%,为风格聚类的实用性提供动态稳定性证据。
  • 表1-3(类别中性化后的单因子表现)

严谨展示了类别中性化对选股收益IC表现及信息比的改善,表明剔除非风格噪声后因子更有效。
  • 图7-8(类别中性化与正交的对比)

视觉展现类别中性化优于直接正交,形成风格因子中性化有效性的直观证据。
  • 表4-6(复合因子及多因子组合表现)

系列表明类别中性化复合因子在IC、收益率及信息比上均超越传统行业中性处理。
  • 表7(沪深300增强组合表现)

详细年度数据揭示类别中性策略在总体表现及风险控制上的优势及其在行业特征明显年份相对劣势,彰显策略适应性特征。
  • 图9-10(行业分化度与组合相对收益关系)

负相关且具有显著统计意义,强调市场风格与行业特征对策略表现的联动影响。
  • 表8-10(动量因子选股效果及截面溢价)

量化数据坚实支撑行业与风格分类动量双重独立溢价观点。
  • 图11-16(动量因子多空净值及分组收益)

详尽展现动量策略的表现曲线,凸显风格动量策略的长期可行性及与行业动量的互补。

以上图表系统支撑全文论点,数据详实、逻辑连贯,是报告结论的核心证据基础。[page::5-8,10-12]

---

4. 估值分析



本报告主要聚焦于股票分类方法及其在多因子模型应用中的影响,未涉及传统意义上的标的估值或目标价格设定,因此未包含DCF、市盈率等估值方法分析。其估值价值体现在因子预测能力的提升和增强组合的风险收益表现优化。[page::全文中无]

---

5. 风险因素评估


  • 模型误设风险:所建模型基于历史数据和统计特征,可能因模型设定偏差或变量选取偏差导致预测能力下降。

- 历史统计规律失效风险:市场结构变化、政策风格变动或黑天鹅事件可能破坏风格特征稳定性,风格分类的历史绩效不再持续。

报告未详细展开缓解措施,但客观认识风险,提示投资者警觉模型和历史经验的局限性。[page::0,13]

---

6. 审慎视角与细微差别


  • 潜在偏见:采用K-means并参考行业确定簇数和初始质心,存在对行业划分的依赖和可能的样本选择偏差。

- 风格变量选择限定:只用市场特征和部分基本面指标,未包含诸如成长性、波动率等其他风格因子,分类维度限制了认知范畴。
  • 市场环境依赖:年份间业绩差异明显,说明策略表现与市场行业分化度、风格趋势显著相关,外推至不同市场状态需谨慎。

- 中性化与正交处理差异需深入理解:类别中性化并非简单线性正交,实务应用需精准把握其对因子暴露的调节效应。
  • 未充分讨论策略交易成本及实操风险:如换手率、滑点对增强组合的影响未述及,需后续关注。


总体分析严谨,数据完整,结构逻辑清晰,但多因子投资复杂,仍需结合实际场景和不断校准风险[page::6-7,9-10,13]

---

7. 结论性综合



本报告创新性地提出基于风格特征(市值、估值、盈利、关注度)运用K-means聚类算法对A股股票进行重新分类,实证表明风格分类独立于传统行业分类,有助于揭示基本面和风格因子间更为细致的结构信息。通过类别中性化处理,报告系统证实其极大地提升了多因子模型的选股稳定性、因子信息比和组合超额收益,且在风险控制策略下实现了更优的风险调整表现。

同时,风格分类亦显著表现出动量溢出效应,并与行业动量效应相对独立,二者结合可提供更丰富和有效的动量捕捉能力,增强多因子模型的动态适应性和收益提升空间。

多个详尽的数据表格和时间序列图清晰展示了该方法的科学性和有效性,尽管存在模型设定与历史规律失效风险,但该方法扩展了股票分类及多因子投资的理论及实务边界,具有重要的应用价值和推广潜力。

总体而言,报告提出的风格确认分类及类别中性化方案,有望成为量化和智能投资领域完善股票风格因子构建、提升策略收益与风险管理的新思路,并为未来研究提供重要参考基点与实证支持。[page::0-13]

---

参考重要图表


  1. — 风格分类与行业分类的平均相似度,长期稳定但偏低,说明分类视角差异明显。

2. — 风格分类与行业分类最大相似度趋势,显示最大匹配指标的动态变更。
  1. — 分类稳定性演进曲线,体现聚类持续性的量化。

4. — 类别中性化优于正交处理的因子分组收益表现。
  1. — 类别中性化对应ICIR及多空收益IR对比,实证强化。

6. — 行业分化度与类别中性组合相对收益的负相关性。
  1. — 类别中性化组合累计超额收益明显优于行业中性化组合。

8. — 周度行业动量多空净值曲线,显示动量策略优异的时间表现。
  1. — 周度风格动量与行业动量对比净值,强调其独立性及互补性。


---

总结以上,报告逻辑严密,论证充分,数据详实,为投资者及研究人员在提升选股模型有效性和风险控制层面提供了新方法和实证支持。应用类别中性化及风格动量溢出效应,能够从股票风格视角丰富传统行业划分,优化多因子策略表现,提升风险调整后的收益水平。

[全文引用页码:0,4-13]

报告