`

【光大金工】因子分域初探 确定分域方式 量化选股系列报告之十四

创建于 更新于

摘要

本报告系统探讨了因子分域建模的基本框架和方法,通过案例展示截面分域(离散型和连续型)、时间序列分域以及分域合成方法。研究发现,因子分域相较于传统多因子模型能明显提升选股因子收益和稳定性。报告重点分析了估值因子、早盘收益因子和反转因子的分域改进,进而结合线性与非线性因子多模型拟合技术进行分域合成,利用同花顺量化因子库进行实证,分域后因子表现显著优于原始因子,年化收益率、夏普比率及IC均得到提升,为多因子策略设计提供了有效思路与实践指导。[page::0][page::1][page::2][page::3][page::4][page::5][page::6][page::7][page::8][page::9][page::10][page::11]

速读内容

  • 因子分域的重要性及逻辑[page::0][page::1]:

- 传统多因子模型忽视股票间基本面和量价属性差异,适用低估值大盘股与高估值成长股的因子表现不一。
- 通过单季度ROE同比将股票分域,分域后反转因子表现更优,尤其在高ROE组提升多头收益。


  • 因子分域框架:因子计算与因子合成[page::2]:

- 因子计算涵盖截面分域(离散型与连续型)与时间序列分域。
- 因子合成为多模型拟合和分域合成,分别针对线性和非线性因子实现最佳拟合与整合。

  • 截面分域案例:估值因子分域表现[page::3][page::4]:

- 按市值离散分域显示小市值域的估值因子有更稳健收益。
- 通过对数市值倒数加权构建连续型分域,因子总收益由213.74%提升至346.36%,周频Rank IC由3.85%提升至4.69%。


| 分域类型 | 总收益率 | 年化收益率 | 年化波动率 | 夏普比率 | 最大回撤 | 月度胜率 | 周频RankIC |
|------------|----------|------------|------------|----------|----------|----------|------------|
| 全域 | 213.74% | 11.64% | 5.23% | 1.65 | 7.80% | 65.63% | 3.85% |
| 大市值分域 | 233.37% | 12.30% | 6.07% | 1.53 | 8.56% | 66.41% | 3.60% |
| 小市值分域 | 261.41% | 13.18% | 4.60% | 2.21 | 5.36% | 75.00% | 4.94% |
| 加权因子 | 346.36% | 15.50% | 5.78% | 2.16 | 6.93% | 74.22% | 4.69% |
  • 时间序列分域案例:早盘收益因子改进[page::4][page::5]:

- 原始早盘收益因子表现反转,改进通过时序极值分域,将涨跌幅超2%的收益取反,令因子呈现稳定动量效应,年化收益率由-8.43%提升至13.89%,夏普由-1.83提升至2.71。


| 因子类型 | 总收益率 | 年化收益率 | 年化波动率 | 夏普比率 | 最大回撤 | 月度胜率 | 周频RankIC |
|----------|----------|------------|------------|----------|----------|----------|------------|
| 原始因子 | -59.90% | -8.43% | 6.26% | -1.83 | 62.75% | 32.03% | -3.12% |
| 改进因子 | 285.80% | 13.89% | 4.01% | 2.71 | 3.57% | 82.81% | 4.08% |
  • 时间序列分域案例:反转因子改进[page::5][page::6]:

- 通过成交量/成交笔数指标对反转因子进行分域,改进版本具备更稳健表现,月度胜率和夏普比率提升,改进因子多头组年化收益率达13.82%。


| 因子类型 | 总收益率 | 年化收益率 | 年化波动率 | 夏普比率 | 最大回撤 | 月度胜率 | 周频RankIC |
|----------|----------|------------|------------|----------|----------|----------|------------|
| 原始因子 | 460.84% | 18.07% | 7.69% | 1.96 | 8.69% | 75.78% | 5.23% |
| 改进因子 | 369.92% | 16.08% | 5.04% | 2.60 | 9.99% | 87.50% | 4.57% |
  • 因子合成:多模型拟合与分域合成[page::6][page::7][page::8]:

- 传统等权因子合成简单但忽视因子间非线性关系,针对基本面及量价因子采用多模型拟合,先分别建模,后合成综合因子。
- 采用非线性因子转换技术,实现由非线性到线性的映射,提升多因子组合表现和稳健性。




  • 同花顺量化因子库及分域合成实证[page::9][page::10]:

- 从同花顺近600因子中选取5个典型因子,构建多空组合,展示各因子历史收益和性能指标,最大年化收益达22.88%,夏普3.15。
- 以风格因子(市值、价值、成长、盈利、流动性)各分域测算因子周频RankIC,发现成长、盈利、流动性能够显著提升因子表现,特别是流动性分域将因子年化收益由27.44%提升至32.29%。


| 因子符号 | 总收益率 | 年化收益率 | 年化波动率 | 夏普比率 | 最大回撤 | 月度胜率 | 周频RankIC |
|----------------|----------|------------|------------|----------|----------|----------|------------|
| RLDAYMFALPHA1 | 323.69% | 18.71% | 6.97% | 2.25 | 8.52% | 78.85% | 6.78% |
| RL
DAYALPHA17 | 351.04% | 19.59% | 5.26% | 3.15 | 5.53% | 89.42% | 7.09% |
| SS
RDOR | 144.70% | 11.21% | 3.85% | 2.14 | 4.72% | 78.85% | 11.50% |
| SS
RDTS | 56.50% | 5.46% | 2.58% | 0.96 | 5.57% | 73.08% | 8.64% |
| RL
TSSJ_ALPHA4 | 466.90% | 22.88% | 6.36% | 3.12 | 7.68% | 85.58% | 7.00% |

| 类型 | 总收益率 | 年化收益率 | 年化波动率 | 夏普比率 | 最大回撤 | 月度胜率 | 周频RankIC |
|----------|----------|------------|------------|----------|----------|----------|------------|
| 基准因子 | 670.37% | 27.44% | 6.03% | 4.05 | 6.12% | 88.46% | 12.05% |
| 分域因子 | 954.99% | 32.29% | 6.61% | 4.43 | 6.00% | 88.46% | 13.25% |

深度阅读

【光大金工】因子分域初探 确定分域方式——量化选股系列报告之十四 深度分析报告



---

1. 元数据与报告概览


  • 报告标题:《因子分域初探 确定分域方式 量化选股系列报告之十四》

- 作者:祁嫣然、张威
  • 发布机构:光大证券股份有限公司金融工程研究团队

- 发布时间:2024年9月27日
  • 主题:多因子模型中的因子分域方法研究,重点探讨如何根据不同维度对股票池进行分域,以提升量化选股因子的表现。

- 报告核心论点
- 传统多因子模型均等对待全市场股票,忽视了股票在基本面和量价特性上的差异;
- 因子分域是通过对股票池进行分类(行业、市值、盈利能力等),对因子进行差异化计算和合成;
- 通过因子分域,因子表现相较原始因子有显著提升;
- 报告从因子计算(截面分域和时序分域)与因子合成(多模型拟合和分域合成)两大方面构建因子分域框架;
- 结合实证案例,如估值因子、早盘收益因子、反转因子及同花顺量化因子库,验证因子分域有效性。

本报告针对因子分域的分类方法、建模框架及实际应用进行了详尽剖析,旨在为投资者和量化研究人员提供系统的因子分域方法论指导。[page::0,1,2]

---

2. 逐节深度解读



2.1 报告摘要及引言


  • 关键点总结

- 传统多因子模型忽视股票间多样性,导致部分因子在某些股票域表现不佳;
- 因此提出因子分域的需求,通过划分股票子池后差异化因子计算与合成,实现因子效能提升;
- 因子分域主要应用于因子计算和因子合成两个环节;
- 分域类型包括截面分域(行业、市值等)和时序分域(时间维度极值调整等);
- 研究结果显示,因子分域能够有效提升选股因子的质量和表现。
  • 逻辑及假设

- 不同类型股票在基本面和量价特征上差异显著,因此应区别对待;
- 通过分域,对不同分区中的因子权重或计算方式做差异化处理,进而获得优化效果;
- 假设分域方法能够捕捉基本面及市场环境变化带来的因子表现差异。

该摘要确立了因子分域研究的重要性及核心研究框架,为后续详见奠定基础。[page::0]

---

2.2 因子分域建模的逻辑与实证案例


  • 因子分域的基本逻辑

- 传统多因子模型统一对全市场股票排序打分,并未识别不同股票池的特质差异;
- 通过行业、盈利能力(如单季度ROE同比)、市值等指标划分分域,每个域内针对性地计算和应用因子;
- 举例:反转因子结合单季度ROE同比进行分域,多头组在高ROE分域表现优异,空头组负收益主要来源于低ROE分域,说明该分域方法区分效率显著提升。
  • 实证图表说明

- 图1-4展现反转因子分域后多头/空头组合净值曲线,明显高ROE分域耐跌性更强,多头收益更稳定。




  • 风险提示

- 基于历史数据,存在未来表现不可重复的风险。

结合多因子模型的传统弊端,报告提出分域量化框架,有助于提取各领域的Alpha信号,提升模型收益稳定性。[page::1,2]

---

2.3 因子计算的分域方法详解



2.3.1 截面分域


  • 离散型分域

- 将股票池根据某一指标(如单季度ROE、行业、市值)划分子池;
- 如市值划分大市值和小市值两个域,发现估值因子在小市值域表现优异,收益稳健,夏普比率明显高于全市场表现,体现显著分域效应。
  • 连续型分域

- 利用权重函数,将分域因子连续作用于目标因子;
- 如以对数市值倒数的幂函数给估值因子加权,强化小市值权重;
- 结果显示:市值加权提升估值因子的总收益率(从213.74%提升至346.36%),夏普比率由1.65提升至2.16,回撤轻微减少,月度胜率与Rank IC均有显著提升。
  • 关键数据与指标


表1&2详细对比了原始与分域后的估值因子表现,涵盖总收益率、年化收益率、波动率、夏普比率、最大回撤、月度胜率及Rank IC,全面反映分域优势。

图6&7净值曲线及图8多空组合对比直观显示分域改进带来的持续超额收益趋势:






  • 数学公式解释权重函数的逻辑,为分域知识提供数学依据。


总结来看,截面分域通过离散和连续两种方式细分股票池,显著提高因子的解释力和选股效能。[page::3,4]

---

2.3.2 时序分域


  • 定义

- 在时间序列维度对因子进行极值调整或划分域,实现修正因子计算方法。
  • 案例:早盘收益因子


- 原始早盘收益因子定义及计算公式,基于9:30-10:30成交量加权价格涨幅与开盘价涨幅之差;
- 回测显示早盘收益因子原表现不佳,且多空组合呈反转特征(图9、图10)




  • 改进方法

- 采用时序极值调整,将单日早盘收益率绝对值大于2%的取反,过滤极端收益的扰动;
- 改进后因子呈现稳定动量特征,显著提升收益率和夏普率(图11、图12,表3)




  • 反转因子时序分域案例


- 原始1月反转因子分组收益不稳定(图13);
- 通过成交量/成交笔数构造分域指标,测算改进反转因子,呈现更明显单调分组收益(图14);
- 多空组合风险调整后收益较低版本稳定,夏普比率及月度胜率均有提升(图15-16,表4、5)








  • 时序分域赋能因子修复的关键,通过对因子极端表现治理,实现风险调整后的风险收益曲线优化。


总的来看,时序分域方法有效修正因子极值扰动,挖掘潜在动量与反转效应。[page::4,5,6]

---

2.4 因子合成与多模型拟合


  • 因子合成的挑战

- 传统因子等权合成忽视了因子间表达差异和信息挖掘,如非线性因子难以直接线性加权;
- 经典线性回归模型难以应对多重共线性、非线性关系和复杂隐藏结构。
  • 案例分析

- 组合了若干基本面和量价因子(表6),观察2022年前后加权与等权表现差异;
- 发现基本面因子(如SUE)在2022年后失效且表现反转,导致加权组合表现落后于简单等权(图17-18)。




  • 非线性因子转换示意

- 通过距离中位数的方式将非线性分布转化为线性分布,增强模型对非线性因子的处理能力(图19)。


  • 多模型拟合构思

- 将因子池分为量价因子池和基本面因子池,两类因子分别采用专门模型低相关拟合,最终合成综合因子(图20);
- 解决多频率、多表现形式的因子兼容问题,提升模型整体拟合能力和Alpha挖掘力度。



整体来看,多模型拟合通过分域思想抓取不同信息类别,实现分工明确的组合优化,是因子合成的有效路径。[page::6,7,8]

---

2.5 分域合成及同花顺量化因子应用


  • 问题描述

- 多因子多分域因子并存,如何整合选股因子和分域因子,获得更优组合表现?
  • 应用背景

- 采用同花顺量化因子库,该库因子类型多样,涵盖不同频率量价数据、基本面及另类数据,且融合机器学习技术,保证了数据和因子质量(图21)。


  • 精选因子简介

- 挑选了5个代表性量价强化学习及集合竞价因子(表7),均经验证具有稳定预测能力。
  • 单因子表现实证

- 多空组合净值曲线(图22)显示部分因子表现突出,年度收益率和夏普明显优于均值水平(表8)。


  • 分域后的Rank IC表现

- 以五种风格因子(市值、价值、成长、盈利、流动性)为分域因子计算各量价因子子池IC表现(表23);
- 结果显示成长、盈利、流动性三个维度分域效果显著,提升因子预测能力;
  • 具体示例:流动性分域提升因子表现


- 在低流动性域,以分域因子构建整体组合与等权基准比较,显示分域策略带来显著年化收益及Rank IC提升,夏普与回撤水平均优于基准(图24,表9)。



此部分展示因子多维度分域及合成的应用范式,结合大规模量化因子库,从分类到回测均验证了分域合成的效用。[page::8,9,10]

---

2.6 风险分析与总结


  • 风险点

- 因子分域与因子计算均基于历史数据,历史效应存在未来不可持续及过拟合风险;
- 复杂模型结合机器学习及深度学习,模型稳定性和解释性需进一步验证;
- 市场结构变化、交易成本等未在回测中完全体现,现实应用存在差异。
  • 总结观点

- 传统全市场因子排序忽视股票间多样化,因子分域适应性更强,如行业、市值、盈利等维度分域可提高因子表现;
- 因子分域包括计算分域(截面离散/连续,时间序列)和合成分域(多模型拟合、动态情景模型);
- 实证表明估值因子、早盘收益因子、反转因子均通过分域得到显著收益提升;
- 分域模型在同花顺量化因子库大规模应用中同样展现较优表现;
- 因子分域提升模型稳定性和预测能力,有助于搭建更为精准的量化选股框架。

报告最后强调因子分域的实际重要性及未来研究方向,同时明确风险提示,整体论据充足,实证充分。[page::10,11]

---

3. 图表深度解读



| 图编号 | 内容描述 | 关键点与趋势 | 关联论点 |
|---------|----------|--------------|---------|
| 图1-4 | 反转因子结合单季度ROE同比进行多头/空头组合净值曲线 | 反转因子在高ROE分域表现更佳,多头收益更稳健,空头分组较低ROE贡献负收益 | 验证以盈利能力为分域基准因子提升反转因子表现 |
| 图6-7 | 估值因子离散型分域大市值/小市值多空组合净值 | 小市值域表现明显优于大市值及全市场 | 市值作为离散型分域的有效维度 |
| 图8 | 市值加权估值因子多空组合净值(连续型分域) | 加权后表现明显优于原始,收益及夏普提升 | 权重连续分域提升因子效果 |
| 图9-12 | 早盘收益因子原始与改进版分组净值与多空组合表现 | 极值调整后呈现单调分层,动量效果显著增强 | 时序分域补强因子极端数据修复 |
| 图13-16 | 反转因子及改进反转因子分组净值与夏普比较 | 改进因子更稳健,夏普率提升 | 成交量/笔数分域优化传统反转因子 |
| 图17-18 | 基本面因子与量价因子等权与加权多头净值对比 | 基本面加权表现随因子失效而波动 | 渲染多因子合成复杂性及时效性风险 |
| 图19 | 非线性因子变线性示意 | 通过距离中位数转换线性 | 说明多模型拟合的建模思路 |
| 图20 | 因子分域建模流程图 | 量价及基本面因子分别拟合后合成 | 该方法提升模型的泛化能力 |
| 图21 | 同花顺量化因子库结构 | 展示多维度量价、基本面与算法因子 | 因子多样性与数据处理能力的背景介绍 |
| 图22 | 选中同花顺因子多空组合净值 | 不同因子表现差异,RLTSSJALPHA4最优 | 验证因子库优质因子趋势 |
| 图23 | 风格因子分域RankIC对比 | 成长、盈利、流动性分域效应强 | 分域因子对因子表现的关键影响 |
| 图24 | 流动性分域后多空组合净值对比 | 分域因子表现优于基准 | 分域提升因子的收益率与稳定性 |

---

4. 估值及模型评述



报告未涉及公司估值,但因子分域方法可看作对多因子模型(常用于量化策略的风险及收益预测工具)的改进,属于策略性能优化范畴。
  • 核心模型

- 因子计算阶段采用截面离散、连续权重及时序极值调整;
- 因子合成阶段采用多模型拟合,将因子池拆分成线性、非线性子池分别建模,利用机器学习等先进方法解决多重共线性及非线性问题;
- 对多分域多个因子采用动态情景Alpha模型整合;
  • 输入假设

- 股票特征区分显著,分域因子稳定且有区分能力;
- 历史数据能代表未来结构、因子有效性持久;
- 多模型结合优于简单等权或加权线性模型。

对此,报告在实证部分提供了充分的历史回测支撑,不过承认因子失效与历史样本偏误风险,表现出分析审慎性。

---

5. 风险因素评估


  • 历史数据依赖风险:因子表现基于历史数据,未来市场机制、风格、结构变化或导致历史效应不再成立。

- 模型过拟合与复杂度提升风险:多模型拟合虽提升了拟合能力,但可能存在过拟合风险,影响实际应用的稳健性。
  • 市场环境变化风险:量化因子及分域假设可能因宏观政策、流动性环境等外部因素发生变化。

- 做空限制风险:以单季度ROE同比对反转因子分域时提及A股做空受限,削弱空头组收益构建。
  • 执行及交易成本风险:报告未体现因子实施的交易成本、滑点,可能影响策略净收益。


报告对主要风险进行了明确提示,但未详细量化缓解措施,投资者需结合自身风险承受评估谨慎应用。[page::1,11]

---

6. 批判性视角与细微差别


  • 偏见与假设风险

- 因子分域强假设不同域内因子表现稳定且差异显著,市场结构若发生剧变,分域效应可能减弱;
- 使用部分财务指标如单季度ROE同比作为分域基准,有一定滞后性和数据完整性风险;
- 多模型拟合引入机器学习,增加模型复杂度,潜在黑箱风险和过拟合隐患;
- 报告主要围绕A股市场,适用性对外部市场未加说明。
  • 内在逻辑一致性

- 报告内逻辑连贯,案例设计精细,分域方法衔接紧密;
- 以多个因子实例说明分域效果,数据与图表充分配合;
- 唯一细微之处在早盘收益因子改进步骤隐含调节阈值选取可能存在优化空间,未细述阈值确定机制。

总体保持专业客观,结论基于全面数据,但仍需注意实际应用和数据局限带来的不确定性。

---

7. 结论性综合



本报告系统而详尽地揭示了因子分域建模的原理、方法和实证应用,具体结论如下:
  • 传统多因子模型的全市场排序方式忽略了股票在基本面、市值、盈利能力及流动性等方面的差异,导致部分因子表现欠佳,限制选股效率。

- 通过对股票池进行分域,采用截面分域(离散/连续)、时序分域两种方式对单因子进行差异化计算,显著提高因子收益和信号稳定性。
  • 反转因子通过单季度ROE同比分域、估值因子通过市值分域、早盘收益因子通过极值时序调整均表现更佳,夏普比率、收益率、Rank IC均提升。

- 因子合成阶段引入多模型拟合思路,将量价因子和基本面因子分别建模,有效解决非线性及多重共线问题,提高多因子模型的泛化能力。
  • 同花顺量化因子库涵盖丰富多样因子类型,通过风格因子多维度分域,在提升因子选股能力方面效果显著,分域因子策略收益率和稳定性均大幅优于基准。

- 报告充分利用图表和数据验证分域的正向作用,结合数学公式和实际案例,理论与实证兼备,体现研究的深度和广度。
  • 同时,报告审慎提示基于历史数据构建模型的固有限制及潜在过拟合风险,建议投资者结合风险管理审慎应用。


综上,报告确立了因子分域在量化选股中提升Alpha捕获能力和风险调整表现的核心地位,展现未来因子建模的重要发展方向。

---

参考文献及资料来源


  • 光大证券金融工程研究团队,《因子分域初探 确定分域方式 量化选股系列报告之十四》,2024年9月27日发布[page::0-11]

- Wind数据库
  • iFinD同花顺量化因子库


---

扫描报告时间序列中的重要图表(示例)













以上为报告全部重要观点及数据的全面解析。

报告