`

金融工程 分域法改进因子的新尝试——量化选股系列报告之十五

创建于 更新于

摘要

本报告围绕因子分域方法在因子计算阶段的应用展开,重点探讨了截面分域和时序分域两种方式。利用遗传规划算法挖掘并改进了估值因子、动量因子及反转因子等,显著提升因子表现,多空组合绩效及周频Rank IC均有较大改善,实证验证了分域法的有效性 [page::0][page::4][page::15][page::22][page::23]。

速读内容


因子分域研究框架与逻辑 [page::4][page::8][page::9]

  • 分域法主要用于因子计算与因子合成两个步骤,本报告聚焦因子计算的分域应用。

- 常见分域分为截面分域(如行业、市值分组)和时序分域(如基于时间序列数据极值调整)。
  • 连续型分域通过加权实现,离散型分域通过划分组别实现,时序分域利用时间窗口与算子优化目标因子表现。


  • 通过比较分域后因子的Rank IC与原始因子Rank IC,确定分域操作有效性。


基于遗传规划的因子分域方法介绍 [page::10][page::11][page::12][page::13]

  • 遗传规划算法模拟生物进化,通过交叉、变异等操作生成并优化数学表达式,用于挖掘潜在有效因子。

- 算法基本操作包括交叉(exchange)、子树变异(subtree mutation)、点变异(point mutation)、Hoist变异,用以维护种群多样性和公式简化。
  • 构建了时序分域算子(如tsmaxmean, tsminmean等),结合标准时序算子和一般算子进行复杂分域方程生成。



| 算子(X,Y,window1,window2) | 说明 |
|-----------------------------------|----------------------------------------------|
| tsmaxmean | 对数据X,计算历史window2个交易日中,Y数据最大的window1个交易日对应的X的均值 |
| tsminmean | 计算Y数据最小的window1个交易日对应的X的均值 |
| tsmaxmeanminusminmean | tsmaxmean - tsminmean |
| ts
maxstd | 计算Y数据最大的window1个交易日对应的X的标准差 |
| ts
minstd | 计算Y数据最小的window1个交易日对应的X的标准差 |
| ts
maxstdminusminstd | tsmaxstd - tsminstd |

估值因子分域改进及回测表现 [page::4][page::5][page::16]

  • 以单季度营业收入同比增长率(SalesYOY)为原始因子,分域因子为“近8日最高价的标准差减当天成交笔数”构建改进因子。

- 改进因子多空组合远超原因子,样本外区间内表现优异,周频Rank IC由0.8%提升至6.68%。

| 指标 | 原始因子 | 改进因子 |
|------------|---------|---------|
| 总收益率 | 37.23% | 627.23% |
| 年化收益率 | 3.07% | 20.90% |
| 夏普比率 | 0.02 | 3.55 |
| 最大回撤 | 10.19% | 7.14% |
| 周频Rank IC | 0.80% | 6.68% |

净利润同比因子分域改进及表现 [page::17]

  • 原始因子:单季度净利润同比增长率(ProfitYOY)。

- 分域因子为当日成交笔数与换手率的加权。
  • 改进后因子周频Rank IC由1.25%提升至8.31%。


| 指标 | 原始因子 | 改进因子 |
|-----------|--------|---------|
| 总收益率 | 40.26% | 1001.05% |
| 年化收益率 | 3.29% | 25.79% |
| 夏普比率 | 0.09 | 3.94 |
| 最大回撤 | 11.15% | 4.69% |
| 周频Rank IC| 1.25% | 8.31% |

反转因子及动量类因子分域改进 [page::18][page::19][page::21]

  • 反转因子(5日反转)改进分域因子为“过去14日开盘最低价的5日变化率减成交笔数”,周频Rank IC由3.77%提升至8.03%。

- 时序分域改进的15日反转收益因子,基于“收益率最大5日均值减最小5日均值”为分域算子,周频Rank IC由4.96%提升至8.45%。
  • 尾盘收益因子及振幅因子的分域改进也带来了性能提升,周频Rank IC分别由4.89%提升至7.85%,6.12%提升至6.92%。



| 指标 | 原始因子 | 改进因子 |
|-----------|--------|--------|
| 5DR总收益率 | 246.37% | 722.04% |
| 5DR年化收益率| 12.62% | 22.32% |
| 5DR夏普比率 | 1.48 | 3.41 |
| 周频Rank IC| 3.77% | 8.03% |

结论与风险提示 [page::22][page::23]

  • 因子分域能够挖掘不同市场环境下因子的独特表现和优势,显著提升因子表现和选股效果。

- 遗传规划算法辅助发现潜在有效的分域因子,为因子改进提供新思路。
  • 风险提示:研究基于历史数据和模型,存在模型失效与历史不可重复的风险。


深度阅读

金融工程报告——分域法改进因子的新尝试详尽分析



---

1. 元数据与报告概览


  • 报告标题:《分域法改进因子的新尝试——量化选股系列报告之十五》

- 作者与机构:祁嫣然、张威,光大证券研究所
  • 发布时间:2024年

- 主题:因子分域方法在量化选股中因子计算环节的应用及基于遗传规划算法的改进尝试
  • 核心论点

报告主张通过因子分域(截面分域和时序分域)对传统因子进行有效改进,能够显著提升因子的预测效率和回测表现。采用遗传规划算法可挖掘潜在分域因子和分域方式,进一步提升因子表现。报告重点在因子计算环节引入分域思想,并结合实证验证改进效果。
  • 评级与目标价:未提供明确股票评级与目标价,研究性质偏方法论和策略研究。

- 关键信息
- 因子分域思想由来已久且应用广泛
- 以估值因子和早盘收益因子为示例展示改进效果
- 结合遗传规划算法发掘更优分域组合
- 多个传统失效的因子通过分域有明显提升

---

2. 逐节深度解读



2.1 因子分域建模逻辑


  • 关键点

分域通常用来区分股票集合(基于行业、市值等截面特征)或基于时间序列不同阶段特征,对因子进行差异化处理以更精准地反映资产特性和市场信息。报告中区分了截面分域和时序分域两大类。
  • 逻辑支撑

例如估值因子在大盘股和小盘股内表现差异明显,单纯在整体市场用同一公式计算因子表现不佳。时间序列上如早盘收益极端波动也影响因子表现,作极值处理后动量效果更清晰。

2.1.1 对估值因子的修复


  • 说明与举例

估值因子在2019-2021年下行明显,尤其在大盘股。将市值作为分域因子,区分大盘和小盘市值,发现小市值股票中的估值因子依然稳定有效。
  • 数据解读

- 图1(估值因子净值曲线)展示多头组持续增长,多空净值分离明显。
- 图2(大市值和小市值分域净值表现)显示小市值分域表现更好(累计收益更高)。
  • 改进方法

利用市值倒数构建权重函数,进行连续型分域,提升小盘股权重,体现更丰富的估值信号。n参数,随着n从0(原始因子)到4增加,提升度增强。
  • 定量指标(表1及图3、表2):

- 小市值分域因子总收益率最高达到261.90%(年化13.09%),夏普比率2.20远高于全市场1.65。
- 连续加权分域方法使周频Rank IC从3.84%升至4.67%,月度胜率由65.89%升至74.42%[page::4,5]。

2.1.2 对动量因子的修复


  • 问题

早盘收益因子用原始方式计算无明显动量效应,是因早盘极端价格影响造成。
  • 改进方式

时序分域极值调整策略,早盘收益率绝对值超出2%时取其相反数,实现“温和”收益解释。
  • 结果说明(图4-7表3):

改进后早盘收益因子夏普由负转正,年化收益率由-8.43%升至13.76%,最大回撤大幅收窄,周频Rank IC由负值转正[page::6,7]。

2.2 分域法因子改进研究框架


  • 分域类型划分:

- 截面分域:包括离散型(如行业分组)和连续型(如权重调整)
- 时序分域:对时间窗口和极值进行调整或重构因子计算方法
  • 分域流程:定义分域因子Y,使用分域算子调整目标因子X,产生新因子Z。


  • 验证标准:分域因子效果通过因子的Rank IC提升判定。


---

3. 遗传规划算法介绍与改进


  • 遗传规划简介

模拟生物进化过程,通过公式表达树结构进行基因交叉、变异等,寻找最优因子表达式。适用性强,可突破人类直觉限制。
  • 算法操作细节

- 公式树的交叉、子树变异、点变异、Hoist变异等操作保证公式群体多样性和进化方向。
- 以平均IC或回测收益率作为适应度。
  • 分域算子扩展

- 引入时序最大均值(tsmaxmean)、最小均值(tsminmean)、标准差以及其差值等复合算子。
- 结合winsorize、standardize和sigmoid函数实现截面连续分域。
  • 模型参数(表7、8):

- 样本内区间为2016~2018年
- 种群500个,迭代次数2(相对较小)
- 交叉概率0.5,变异概率0.2
- 树结构深度限制保证表达式复杂度可控
- 以交易量、换手率、收益率等多种原始数据构建底层因子

---

4. 截面分域改进因子实证展示



4.1 营收同比因子(SalesYOY)
  • 改进分域因子为股票日内波动率和成交笔数差,应用逻辑是脉冲交易活跃度与价格波动结合影响基本面因子表现。

- 改进后,样本外多空组合累计收益大幅突破原始因子(图18,19),平均周频Rank IC由0.8‰提升至6.68‰,夏普比例和月度胜率显著改善(表9)[page::15,16].

4.2 净利润同比因子(ProfitYOY)
  • 分域因子用成交笔数与换手率累计,结合流动性特征改善因子信号。

- 改进后多头组虽有短期回撤波动,但整体提升显著,周频Rank IC由1.25‰提升到8.31‰(图22-25,表10)[page::16,17].

4.3 反转因子(5日反转,5DR)
  • 反转因子用14日日内最低价变化率减成交笔数作为分域信号,反影短期波动和资金动向。

- 改进因子后多空组合收益和Rank IC均有明显提升(从3.77‰涨至8.03‰)(图26-29,表11)[page::17,18].

---

5. 时序分域改进因子实证案例



5.1 反转因子(15日均值RETURN)
  • 利用收益率的分域统计(最大均值减最小均值)增强信号选择性。

- 改进因子多空组合和多头组显著领先原始因子,周频Rank IC从4.96%提升至8.45%(图30-33,表12)[page::19,20].

5.2 尾盘收益因子(TAIL_RET)
  • 通过尾盘收益率最大均值计算提升稳定性。

- 改进因子表现平滑且较原始稳健,周频Rank IC由4.89%提高到7.85%(图34-37,表13)[page::20,21].

5.3 振幅因子(SWING)
  • 引入对最高价开方处理后的振幅分域,强化行情波动判断。

- 虽经历2023年初回撤,但整体多空收益及Rank IC从6.12‰进步到6.92‰(图38-41,表14)[page::21,22].

---

3. 图表深度解读


  • 图1-3(估值因子分域)

净值曲线、估值因子分域切分显示市值对估值因子影响显著,大市值组表现疲软,小市值组表现优异。市值加权方案(不同n值)呈现权重越重,高潜力因子表现越突出。
  • 图4-7(早盘收益因子时序分域)

原因子多组表现紊乱且动量不明显;经过极值调整分组后,因子呈现清晰单调上升趋势,多空差异明显,收益率和Rank IC指标均明显提升。
  • 图18、22及26-41(各因子多空组合净值和Rank IC对比)

这些系列图表展示分域前后各改进因子多空组合及多头组净值走势,全部案例新因子均显著优于原始因子。Rank IC图显示改进后因子相关性(预测能力)提升,且更加稳定。
  • 表1-14(业绩指标对比)

详细列出了总收益率、年化收益及波动率、夏普比率、最大回撤及时间、月度胜率和周频Rank IC。整体表现显示绝大多数经过分域改进的因子在风险调整收益、稳定性方面相比原始因子均有较大提高。

---

4. 估值分析


  • 报告未涉及直接股票估值或定价模型,重点集中于量化选股因子的设计与改进。

- 因子表现优化间接提升投资组合的风险调整回报。
  • 估值过程以模型回测中的统计指标表现为依据,未展开传统DCF或多因子估值体系构建。


---

5. 风险因素评估


  • 模型风险:基于历史数据和模型设定,存在失效风险。模型优化效果未必能保证在未来市场条件持续有效。

- 数据风险:历史数据的代表性有限,未来市场可能发生结构性变化,导致历史统计规律不再适用。
  • 算法复杂性与解释性:遗传规划生成的复杂因子虽提高预测效果,但可能导致因子含义难以解释,限制实际应用或风险管理。

- 实践落地限制:计算成本、数据延时和交易实施包括滑点等现实问题,可能影响因子策略实际收益。

报告提醒投资者谨慎对待模型结果,不保证持续有效,风险提示明确且合理[page::0,23]。

---

6. 批判性视角与细微差别


  • 迭代次数较少:遗传规划仅迭代2次,种群500,可能影响算法全面搜索能力和最终因子表现的最优性。

- 样本内外区间划分明晰,但未来市场行为的不确定性依然可能掣肘因子效果。
  • 因子解释性仍有限,多采用组合算子和非线性变换,操作复杂度提升,可能对实务落地形成阻碍。

- 部分多头组合回撤明显(如净利润同比因子多头组2023年回撤),反映策略在极端行情下表现可能波动,值得关注。

---

7. 结论性综合



本报告系统阐述了使用因子分域理论和遗传规划算法对传统量化因子进行改进,验证了该方法在A股市场中的有效性和实用价值。通过引入市值加权、极值调整、历史窗口分域等创新算子,实现了对估值、动量等失效或效果弱因子的显著修复。

实证环节涵盖营收同比、净利润同比、反转、早盘收益、尾盘收益及振幅因子,所有改进后的因子在回测表现中均展现出:
  • 总收益率倍增

- 夏普比率大幅提升,风险调整后的收益显著改善
  • 最大回撤缩小或控制改善

- Rank IC提升幅度巨大(部分因子提升超过6倍)
  • 多头组净值曲线凌驾于原始因子之上且波动趋缓


图表详细展示了各改进因子的趋势变化,充分支撑作者观点。遗传规划算法的加入为因子分域问题提供了更多可能,从手动规则演绎转向计算机启发式探索,显示出良好的算法潜力。

尽管存在模型风险和实操解释性的挑战,报告以严谨的理论框架、细致的算法改进、覆盖多个因子的广泛测试,证明了分域法与进化算法结合的量化选股研究新方向,具有重要的学术和实际参考价值。

---

主要引用示例


  • 估值因子小市值分域效果(图1-3,表1-2)[page::4,5]

- 早盘收益极值调整提升(图4-7,表3)[page::6,7]
  • 营收同比分域改进(图18-21,表9)[page::15,16]

- 净利润同比因子改进(图22-25,表10)[page::16,17]
  • 反转因子分域改进(图26-29,表11)[page::17,18]

- 时序分域反转因子改进(图30-33,表12)[page::19,20]
  • 尾盘收益因子改进(图34-37,表13)[page::20,21]

- 振幅因子改进(图38-41,表14)[page::21,22]
  • 风险提示[page::23]


---

总结



此份量化研究报告通过系统的因子分域理论阐述,结合遗传规划算法的创新应用,成功验证了分域法在量化选股因子改进中的有效性。数据及图表严谨完整,多个传统弱势因子经过分域和算法加持后都有显著收益和稳定性提升,为量化因子挖掘及构建提供了新思路。风险提示充分,与市场实际应用保持谨慎态度。该研究对量化投资策略的进阶和优化具有积极借鉴意义。

---

图1:估值因子净值曲线
图3:市值加权估值因子净值对比
图6:改进早盘收益因子-分组净值曲线
图18:因子分域前后多空组合对比(SalesYOY)
图26:因子分域前后多空组合对比(5DR)
图30:因子分域前后多空组合对比(RETURN)
图38:因子分域前后多空组合对比(SWING)

---

(本文所有引用均严格对应页码及数据来源,确保信息追溯的精准和学术严谨)

报告