`

因子分域初探:确定分域方式——量化选股系列报告之十四

创建于 更新于

摘要

本报告围绕因子分域建模展开,探讨如何在量化选股中通过分域提升因子表现。重点介绍因子计算(截面分域与时序分域)及因子合成(多模型拟合及分域合成)两大核心框架。通过估值因子、早盘收益因子及反转因子案例,展示多种离散型与连续型分域方法能够显著优化因子收益和稳定性。同时结合同花顺量化因子库,验证分域合成的优势,提升了选股模型的月度胜率与夏普比率,为量化投资提供了系统的因子分域思路和实证支持[page::0][page::3][page::5][page::7][page::12][page::13].

速读内容


因子分域建模重要性与逻辑 [page::0][page::3]

  • 传统多因子模型未区分股票基本面和量价属性,存在同等处理所有股票的缺陷。

- 通过按照行业、风格(如单季度ROE同比)分域,能够更精准地调整因子权重,提升选股表现。
  • 以反转因子结合单季度ROE同比分域为例,Small组空头贡献较大负收益,表明分域促进了因子的差异化表现。




因子计算中的截面分域与时序分域实证 [page::5][page::6][page::7]

  • 截面分域分为离散型和连续型分域。以估值因子为例,小市值组表现优于大市值组,连续型通过市值加权提升小市值权重效果更佳。

- 市值加权使估值因子年化收益率从11.64%提升至15.50%,夏普比率由1.65提升至2.16。
  • 时序分域以早盘收益因子为例,通过极值调整(阈值2%)改进因子,改进因子年化收益率由-8.43%提升至13.89%,夏普比率由-1.83提升至2.71。








改进反转因子与分域方法验证 [page::8]

  • 利用成交量/成交笔数指标对反转因子进行时序分域,显著改善因子单调性和稳健性。

- 虽然多空组合收益略低于原始因子,但月度胜率和夏普比率均有所提升,多头组表现尤为优异。





| 因子类别 | 总收益率 | 年化收益率 | 年化波动率 | 夏普比率 | 最大回撤 | 月度胜率 | 周频RankIC |
|-|-|-|-|-|-|-|-|
| 原始反转因子 | 460.84% | 18.07% | 7.69% | 1.96 | 8.69% | 75.78% | 5.23% |
| 改进反转因子 | 369.92% | 16.08% | 5.04% | 2.60 | 9.99% | 87.50% | 4.57% |

多模型拟合与非线性因子处理 [page::9][page::10]

  • 传统多因子模型采用等权组合,但线性模型难以处理多重共线性及非线性因子。

- 通过机器学习与深度学习,将非线性因子线性化,实现不同类型因子的低相关子模型拟合与综合。
  • 量价因子与基本面因子分别建模后融合,提高预测的准确性和稳健性。




分域合成:利用同花顺量化因子库实证 [page::11][page::12][page::13]

  • 研究基于同花顺量化因子库约600因子,挑选5个代表性因子,结合风格因子进行分域。

- 分域显著提升因子表现,流动性低域因子年化收益率由27.44%提升至32.29%,周频Rank IC由12.05%提升至13.25%。
  • 分域多空组合净值持续上升,证明多维度分域合成有效提升Alpha信号质量。





| 因子符号 | 总收益率 | 年化收益率 | 年化波动率 | 夏普比率 | 最大回撤 | 月度胜率 | 周频RankIC |
|----------|----------|------------|------------|----------|----------|----------|-------------|
| RLDAYMFALPHA1 | 323.69% | 18.71% | 6.97% | 2.25 | 8.52% | 78.85% | 6.78% |
| RL
DAYALPHA17 | 351.04% | 19.59% | 5.26% | 3.15 | 5.53% | 89.42% | 7.09% |
| SS
RDOR | 144.70% | 11.21% | 3.85% | 2.14 | 4.72% | 78.85% | 11.50% |
| SS
RDTS | 56.50% | 5.46% | 2.58% | 0.96 | 5.57% | 73.08% | 8.64% |
| RL
TSSJ_ALPHA4 | 466.90% | 22.88% | 6.36% | 3.12 | 7.68% | 85.58% | 7.00% |

总结 [page::13]

  • 因子分域通过细分股票池、不同时间窗口及分类,显著提升因子模型表现。

- 分域方法涵盖多种截面分域和时序分域,结合多模型拟合,有效处理非线性因子。
  • 以实际量化因子库验证,分域技术可提升收益率、稳定性及因子IC,是构建高效多因子选股模型的关键步骤。

深度阅读

报告详尽分析:因子分域初探——确定分域方式



---

1. 元数据与概览


  • 报告标题:《因子分域初探:确定分域方式——量化选股系列报告之十四》

- 发布机构:光大证券研究所
  • 发布日期:2024年9月27日

- 作者:祁嫣然、张威
  • 主题:本报告聚焦于量化选股中的多因子模型,尤其关注“因子分域建模”的方法、理论框架及实证表现。报告探讨了因子分域的两大关键应用环节——因子计算与因子合成,并通过丰富的案例(估值因子、早盘收益因子、反转因子及同花顺量化因子库)验证分域后因子表现优异的结论。


核心论点
传统多因子模型常忽视不同股票基本面及量价属性的异质性,采用统一模型进行因子排序和打分,存在因子表现不足的问题。通过引入“分域建模”——即基于行业、市值、风格、时间序列等将股票划分为不同域后独立计算和合成因子,可以有效提升因子表现,增强模型稳定性和预测能力。[page::0,3,13]

---

2. 逐节深度解读



2.1 因子分域建模的逻辑(第3-4页)


  • 关键论点

传统多因子模型假设股票在因子表现上完全可比,但事实上蓝筹股和成长股等差异明显,不同域股票的因子效用不同。故提出通过“分域建模”对股票池按行业、风格(如市值、ROE同比)划分域,通过重新调整因子权重或分组评分,获得更精细的因子信号和更优组合收益。
  • 证据与推理

以反转因子为例,按单季度ROE同比将股票分为“大”和“小”两组(Big、Small)。回测发现小市值组空头损失贡献较大(图1-4)。这种分析揭示,单一因子不能在所有股票池内发挥一致效用,分域后可针对不同股票池优化权重分配。[page::3-4]

2.2 因子分域应用场景综述(第5-7页)


  • 因子计算分域

- 截面分域
- 离散型分域:如按市值大小将市场切分为大小盘,分开计算估值因子。数据显示,小市值股票池中的估值因子表现更稳健(图6,表1)。
- 连续型分域:对估值因子加市值权重,提升小盘股权重,明显提高因子收益率与信息比(图7-8,表2)。数学公式中的权重分配基于对数市值的倒数,并用调节参数n控制权重集中程度。[page::5-6]

- 时序分域
- 结合历史收益数据对早盘收益因子进行极值调整(时序分域),提升因子表现和动量特征(图9-12,表3)。
- 对反转因子使用成交量/笔数指标进行时序分域,构建改进反转因子,表现更稳定且多头收益超过原始因子(图13-16,表4-5)。
- 该方法强调因子在时间上的不同表现,动态调整因子定义和分域策略,实现更精细的信号提炼。[page::6-9]

2.3 因子合成(第9-11页)


  • 多模型拟合

- 直观的等权合成忽略了因子间异质性和非线性关系。报告选取部分基本面因子和量价因子进行对比,发现综合加权模型优于单因子或等权模型(图17-18)。
- 鉴于因子间多重共线性及非线性问题,采用机器学习、深度学习(如LSTM、Transformer等)对因子进行转化及建模。图19展示了非线性因子的线性化转换示意。
- 因量价因子与基本面因子频率差异大,分域建模意味着先对不同类别因子独立训练模型,然后汇总,以充分捕获不同信息源的Alpha信号(图20)。[page::9-10]
  • 分域合成

- 当存在多个分域因子和选股因子时,如何组合成为难题。动态情景Alpha模型能处理多个分域因子。
- 以同花顺量化因子库为例,该库包含数百因子,涵盖多频率量化数据、基本面及另类信息,配合人工智能算法实现因子筛选与组合(图21)。
- 选取5个代表因子,实证显示按风格因子(市值、价值、成长、盈利、流动性)分域均提升因子表现,如流动性分域显著增强综合因子表现,年化收益率由27.44%提升至32.29%(图22-24,表7-9)。[page::11-13]

2.4 总结与风险提示(第13-14页)


  • 总结

报告重申传统全市场因子排序存在异质性问题,分域建模可显著提升因子效用。因子分域包括截面分域(离散和连续)和时间序列分域。分域的应用覆盖因子计算和合成两个阶段。案例包含估值、早盘收益、反转因子及丰富的同花顺量化因子库,均显示出分域显著提高模型表现的能力。
  • 风险提示

所有的回测结果均基于历史数据,存在历史业绩不代表未来表现的风险,投资者应谨慎对待历史数据的预测有效性。[page::13-14]

---

3. 图表深度解读



3.1 反转因子相关图示(图1-4,页3-4)


  • 图1:显示按单季度ROE同比分组的反转因子多空组合净值曲线。多空组合净值(右轴)向上,表明因子整体有效。多头组(大盘ROE)表现稳定上涨,空头组逐渐下滑。

- 图2:Big与Small两组多空组合的净值对比。Small组上涨迅速且高于Big组。
  • 图3 & 图4:分别为多头组与空头组净值趋势。Big组多头表现优于Small,空头组Big组下跌较浅。说明在小市值股票中空头带来较大负收益。

- 联系:支持报告论点,分域能抓住不同股票池中的差异,有利于调整因子权重以提高整体收益。[page::3-4]

3.2 估值因子表现(图6-8,表1-2)


  • 图6:估值因子在大小市值中表现差异明显,小市值多头收益显著更好。

- 图7:大小市值区域中估值因子多空组合累计净值对比,显示小市值域更具超额收益。
  • 图8:计算加权估值因子后,权重聚焦小市值,显著拉升净值曲线,性能持续改善。

- 表1-2:定量指标显示,小市值分域收益率最高(261.41% vs 全域213.74%),波动率最低,夏普比率显著提升,从1.65提高到2.21,加权因子进一步将总收益率提升到346.36%,年化收益率提高至15.5%,夏普比率2.16,最大回撤有所下降,统计指标说明加权后因子更稳定高效。[page::5-6]

3.3 早盘收益因子的时序分域改进(图9-12,表3)


  • 图9-10:原始早盘收益因子表现薄弱,组合净值曲线波动大且多空组合呈反转特征。

- 图11-12:改进因子引入极值截断(abs(morning_ret) > 2%反转符号),在时序上对极值进行分域,表现出更为单调和稳定的动量特征,累计净值有明显弹升。
  • 表3:改进因子年化收益由负转正13.89%,夏普比率由负转正2.71,最大回撤大幅收窄,周频Rank IC由-3.12%变为正4.08%,显示时序分域极值调整显著提高早盘收益因子有效性。[page::7]


3.4 反转因子分域改进(图13-16,表4-5)


  • 图13-14:普通反转因子与基于成交量/笔数进行时序分域的“改进反转因子”,后者表现更单调,组间差异更明显。

- 图15-16:对比多空组合及多头组净值,改进因子多头收益更优,回撤更低且更稳健。
  • 表4-5:总收益率稍逊于原始因子(369.92% vs 460.84%),但夏普比率更高(2.60 vs 1.96),月度胜率和Rank IC均有改善,说明改进因子稳定性更佳,尤其多头组表现明显超越原始因子。[page::8-9]


3.5 多因子合成与多模型拟合(图17-20,表6)


  • 图17-18:多个单因子和组合因子多头净值对比,显示加权组合优于单因子和等权因子组合。

- 图19:非线性因子变线性的示意,表示通过特定转换揭示隐藏的线性关系,提高模型拟合能力。
  • 图20:基于因子特征划分量价与基本面因子,分别进行模型训练,之后合成最终综合因子,系统解决多因子非线性和频率差异问题。[page::9-10]


3.6 同花顺量化因子分域合成(图21-24,表7-9)


  • 图21:因子库架构分为人工挖掘与模型挖掘,覆盖多数据维度及多算法模型,显示数据深度与智能建模能力。

- 图22:选出5个代表因子累积收益表现各异,但均有稳定正收益曲线。
  • 表8:各因子年化收益率区间11%-23%,夏普比率均处于正区间,显示选取因子有效。

- 图23:风格分域效果,显示成长、盈利、流动性因子明显增强部分选股因子的Rank IC,说明风格因子有效用作分域指标。
  • 图24表9:以流动性为分域因子,分域后的同花顺综合因子收益率由670.37%提升为954.99%,年化收益率提升约5个百分点,夏普比率从4.05提升至4.43,最大回撤略有改善。该结果强有力验证分域合成提高因子组合业绩的有效性。[page::11-13]


---

4. 估值分析



本报告本质上为方法论研究报告,未直接涉及证券具体估值目标价,也未采用如DCF等传统估值模型。其重点在于多因子模型的构建与优化方法论,尤其是因子深度挖掘及组合构建技术的提升。报告中对量化因子性能的评估多采用累计收益率、年化收益率、波动率、夏普比率、最大回撤、信息系数(Rank IC)等多指标综合衡量,实证结果反复展示分域策略均能提升因子表现与风险调整收益能力。

---

5. 风险因素评估


  • 历史数据有效性风险:报告特别提醒所有结论基于历史回测数据,历史表现未必重复验证,因市场环境、制度变迁等复杂因素,模型未来表现存在不确定性。[page::0,14]
  • 分域假设固有风险:分域本质上依赖于对股票池差异的识别和划分,错误或不充分的分域可能导致因子信号丢失或过拟合。
  • 因子失效风险:如同文中提及的SUE因子表现变差,因子广泛使用后可能失效,投资者需跟踪维护因子库。
  • 模型复杂性风险:多模型拟合及机器学习方法虽然能捕获非线性信息,但存在过拟合、数据污染等风险,需审慎使用。


---

6. 批判性视角与细微差别


  • 报告高度强调历史回测效果,未详述未来环境变化对因子表现的潜在影响,重点放在模型构建上的技术创新,风险提示较为简略。
  • 对部分关键参数(如时序分域参数、加权因子参数n等)缺少更深入的敏感性分析,未来研究可加强。
  • 非线性因子转换部分呈现图示说明,但未详细披露具体转换公式与算法,可能给读者带来理解难度。
  • 虽然数据充分,但报告多聚焦于统计表现提升,因子经济学解释和市场机制层面探讨较少。


---

7. 结论性综合



本报告系统阐述了量化选股中“因子分域建模”的框架及重要性,核心创新在于:在因子计算和因子合成的阶段引入分域方法,以解决不同股票池和因子特征带来的异质性问题。通过离散型、连续型截面分域及时间序列分域,报告展现了估值因子、早盘收益因子和反转因子显著增强的实例,表现为累计收益率的提高、波动率的降低、夏普比率的提升和信息系数的改善。

在因子合成方面,报告强调因子类别异质性,应用多模型拟合方法解决非线性、频率不同带来的挑战,分离建模基本面与量价因子,进一步利用丰富的同花顺量化因子库,结合人工智能算法对海量因子进行筛选、分域及组合,有效验证了分域合成大幅提升因子池性能的效果。详细的表格和图表说明了该方法在收益及风险控制上的提升,统计指标均显示优异改善。

报告整体立场在于强调因子分域是量化选股模型强化的重要手段,具有显著的实证优势,并为多因子模型未来的改进提供了清晰路径。风险提示中明确指出该方法基于历史回测数据,未来实际应用需警惕模型失效和过拟合风险。

---

附录:重要图表示例


  • 图1-4展示了基于单季度ROE分域的反转因子表现差异。





  • 图6-8说明估值因子分域及加权能力。




  • 图9-12体现早盘收益因子时序分域改进。



  • 图15-16展示改进反转因子回测对比。



  • 图21-24为同花顺量化因子库及分域合成结果。





---

总的来看,本报告详实系统地介绍了因子分域的理论、方法、应用及实证效果,利用丰富数据和多案例从多维度展示了分域在增强量化选股模型表现中的价值和潜力,是量化投资领域重要的参考资料。[page::0-14]

报告