人工智能 79:应用双目标遗传规划构建周频行业轮动策略
创建于 更新于
摘要
本文提出双目标遗传规划模型应用于周频行业轮动,通过同时优化因子单调性(|IC|)和多头组表现(NDCG@k),显著提升策略表现。2022Q3以来,月频行业轮动效果不稳定,双目标遗传规划挖掘的综合因子在2022-09-30至2024-04-30期间实现扣费前年化超额收益25.74%,夏普1.70,最大回撤-21.47%,显著优于单目标模型,兼顾收益和风险,换手率适中。模型采用NSGA-II算法保证种群多样性,挖掘过程使用了26个量价输入变量和64个GPU加速算子,构建高维复杂表达式。通过6个随机种子多轮挖掘并贪心合成因子,同时设训练、验证、测试集体系保证样本外稳健性[page::0][page::2][page::6][page::11][page::12][page::14][page::15][page::17]
速读内容
市场环境与月频行业轮动模型表现回顾 [page::2][page::3]

- 2022Q3后月频行业轮动模型年化超额收益由17%降至约7%
- 市场主线强度下降,换手率提升约40%,行业轮动加快
- 市场主线强弱指标与行业轮动超额收益相关系数0.36,主线强弱影响策略表现
选股因子合成行业轮动因子存在有效性风险 [page::5][page::6]


- 选股因子有效性是行业轮动因子有效的必要非充分条件
- 融合高频和日、周、月频量价数据,生成稳健的周频行业轮动因子
- 2022Q9后周频策略表现更强,年化超额收益约24%,换手率20倍
双目标遗传规划核心原理与算法优势 [page::7][page::8][page::9]


- 以|IC|和NDCG@k两目标评价因子,提高对单调性和多头组表现的综合评价
- 采用NSGA-II快速非支配排序与拥挤距离,维护种群多样性,避免早熟收敛
- 采用64个PyTorch实现的算子扩展表达能力,分为元素级、截面运算、时序运算和切割算子
因子挖掘流程与参数设置 [page::12][page::13]


- 种群规模2500,划分50个小种群并行演化,进化10代,交叉概率0.8,变异0.3
- 采用训练集(约5年数据)、验证集(半年)、测试集(半年)设置,防止过拟合和信息泄露
- 验证测试集均使用超额收益t检验筛选有效因子,保证样本外稳健性
- 使用26个量价输入变量特征,包括原始价量及多周期滚动均值、分位数
多因子合成与策略表现 [page::14]


| 指标 | 数值 |
|----------------|-----------------|
| 年化收益 | 25.81% |
| 年化波动 | 15.17% |
| 夏普比率 | 1.70 |
| 最大回撤 | -21.47% |
| 年化换手 | 单边约13倍 |
- 综合因子扣费前年化超额收益达25.74%,显著优于行业等权基准
- 换手率较低,风险控制良好,兼顾收益和稳健交易
消融实验对比单目标遗传规划效果 [page::15]


- 仅以|IC|或NDCG@k为目标的模型表现远逊于双目标模型
- 以NDCG@k为目标的单目标模型甚至跑输行业等权基准,验证双目标策略有效性优势
- 双目标遗传规划维持多样性,引导因子挖掘路径提升策略表现
因子特色与后续空间 [page::15]
- 时序切割和成交额相关因子为挖掘因子频繁出现的“优秀基因”,体现 分域建模 与 市场交易量的重要性
- 未来可能加入更多输入数据(如基本面)和算子,改进随机种子可控性,提升因子稳定性
- 算子设计和搜索空间约束为后续考虑方向,当前算法在一般配置计算机上8小时内完成任务
深度阅读
双目标遗传规划应用于行业轮动 —— 华泰研究报告深度分析
---
一、元数据与概览
报告标题: 双目标遗传规划应用于行业轮动
发布机构: 华泰证券股份有限公司
发布时间: 2024年5月20日
研究团队: 林晓明、徐特、何康等
研究主题: 通过双目标遗传规划模型挖掘周频率的行业轮动因子,并构建行业轮动策略以适应市场主线弱化、行业轮动加速的趋势。
核心论点:
- 传统月频行业轮动模型在近年市场环境下表现不佳,因市场主线强度下降和行业轮动速度加快。
2. 双目标遗传规划融合|IC|和NDCG@k作为适应度函数,克服单目标遗传规划因子评价维度不全面和种群拥挤的问题,挖掘出既注重因子单调性又关注多头组表现的因子,组合成稳定的周频行业轮动策略。
- 实证表明,2022年9月至2024年4月,双目标模型年化超额收益达到25.74%,夏普比率1.70,换手率适中(单边约13倍),显著优于单目标模型。[page::0]
---
二、逐节深度解读
2.1 背景介绍与市场环境分析
2.1.1 行业轮动的传统研究及现状
行业轮动策略一直是A股投资核心,传统月频模型多采用基本面和技术面对行业景气度和剩余动量因子建模,被证实有效。然而,自2022年第三季度起,电力设备及新能源行情终结,市场主线显著弱化,行业轮动加速,月频模型表现和换手率大幅下滑,年化超额收益由约17%降至7%,换手率提升40%,导致稳定获取超额收益变得困难。[page::2][page::3]
2.1.2 市场主线强度指标设计
报告设计了一套市场主线强度指标,通过多期限(5/10/20/40/60日)的行业收益率排名归一化聚合评价,一旦市场主线强烈,相关指标值接近理论最大0.935,反之低于0.871即视为弱主线。实际结果显示,2022年9月后,市场主线强度均值下降,强主线月占比减少5%,与行业轮动策略超额收益呈正相关(相关系数+0.36),显示主线强弱直接影响模型表现,支持提升调仓频率以适应加速的行业轮动。[page::4]
2.1.3 选股因子合成行业轮动因子问题
选股因子合成行业轮动因子看似合理,但该方法有效性高度依赖于选股因子中行业Beta的占比。经过行业中性化处理会去除行业轮动信息,导致因子无效;若不做中性化则取决于因子是偏重个股Alpha还是行业Beta,运气成分较大,稳定性差。报告基于端到端高频量价数据,综合日、周、月频因子构建因子fh和fl,得到了有效的周频行业轮动因子,尤其在主线弱势阶段表现更佳,超过24%的年化超额收益,换手率高(约20-22倍),体现高级因子挖掘手段的重要性。[page::5][page::6]
2.2 双目标遗传规划(MOGP)模型原理
2.2.1 单目标遗传规划痛点
单目标遗传规划典型流程包括种群初始化、交叉变异、适应度评估(如|IC|)和子代选择,但其适应度函数单一导致因子维度评价片面,容易陷入种群拥挤——优秀个体“基因”趋同,降低进化多样性,影响因子泛化能力。[page::7]
2.2.2 双目标遗传规划流程
双目标遗传规划在适应度评估阶段同时采用两个目标函数(|IC|与NDCG@k),通过非支配排序(NSGA-II算法)解决目标冲突,实现帕累托优化,保证种群内优秀因子多样化,避免“基因”拥挤。其改进包括分割初始种群为多个小种群分别进化,控制进化次数相对较少,进一步维持多样性,提升因子表达能力避免过拟合。[page::7][page::8][page::9][page::12]
2.2.3 适应度函数设定详解
|IC| 衡量因子单调性,即因子值排名与未来收益排名的相关性,偏重整体排序一致性; NDCG@k 聚焦多头端表现,给予表现优异多头组更高权重,反映策略实际多头收益贡献。二者结合既保证因子稳定排序,又注重实战多头盈利能力,提升行业轮动策略表现的稳定性和实用性。[page::11]
2.3 因子挖掘流程与技术细节
因子挖掘覆盖26个输入变量(包括价格、成交额、换手率不同频率的标准化及统计指标),扩展64个PyTorch实现的算子(数学运算、截面和时序运算、时序切割等),并设置了合理的参数(种群规模2500,进化轮次10,交叉概率0.8,变异概率0.3),采用交叉验证思想(训练集、验证集、测试集划分,隔离未来收益窗口防止信息泄露),并以周频率调仓进行实际超额收益检验,同时使用t检验对因子失效进行过滤。[page::9][page::10][page::12][page::13]
2.4 实证分析
2.4.1 双目标遗传规划模型实证表现
2022-09-30至2024-04-30的回测显示,双目标遗传规划构建的周频行业轮动综合因子策略,扣费前年化超额收益约25.74%,夏普比率1.7,最大回撤-21.47%,换手率适中(单边约13倍),相比月频模型年化收益6%-7%、换手率4倍多,优势显著。综合因子采用贪心策略合成,多因子筛选结合了因子之间相关性阈值,是实证上实现的因子多元优化成果。[page::14]
2.4.2 消融实验与单目标对比
对比单目标|IC|和NDCG@k作为适应度函数的遗传规划,单目标方法均明显跑输行业等权基准,尤其以NDCG@k为目标者表现最差(跑输基准)。这验证了双目标方法在因子挖掘中发挥的核心价值,也体现了因子单调性和多头收益的双重优化必要性。[page::15]
2.4.3 因子特征与计算资源
优秀因子以时序切割因子和成交额相关变量为“优秀基因”,反映了“分域建模”思想及市场资金流动对行业轮动的重要作用。
硬件需求适中,普通笔记本即可完成全部演算,约8小时完成6个训练周期计算,具备实用推广潜力。[page::15]
---
三、图表深度解读
图表1、2、3、4、5
- 净值走势图及统计数据清晰展现了双目标遗传规划模型相较于基准组合与月频策略的优势。图1与图2均显示轮动策略净值表现持续向好,且累计收益远超行业等权基准;图4与图5的年化收益率、夏普比率和换手率对比表突出其性能变化和市场环境关联。[page::0][page::2][page::3]
图表6、7
- 市场主线强度指标构建逻辑与实际走势图的强相关性验证了市场主线对策略表现的驱动作用。该模型通过排名均值聚合的方式,定量描述了市场主线强弱,为调仓节奏调整提供理论依据。[page::4]
图表8
- 选股因子合成行业轮动因子的有效性框架,说明该方法效果受行业Beta和选股因子是否做行业中性化影响,路径清晰,逻辑严密。[page::5]
图表9、10、11、12
- 高频次复合神经网络结构说明选股因子挖掘方式,纵深涵盖了不同频率数据,支持量价多层次信息捕捉。相关净值及业绩统计则展示了基于此选股因子的行业轮动模型的稳健表现。[page::5][page::6]
图表13 - 17
- 单目标与双目标遗传规划的流程与算法机制对比图,结合NSGA-II核心概念如非支配排序、拥挤距离和精英选择策略的示意,揭示了双目标模型在保持种群多样性和寻找最优解上的理论优势。[page::7][page::8][page::9]
图表18 - 21
- 因子挖掘中使用算子细分类表细致展示扩充的操作函数,包括元素级运算、截面运算、时序运算和时序切割函数,彰显系统的功能完整性与灵活性,为因子结构多样性提供保障。[page::9][page::10]
图表22
- |IC|与NDCG@k在因子评价场景中的区别通过柱状图形象比喻,强化两者评价侧重异同的直观理解,这是双目标遗传规划选用两个目标函数的核心解读支点。[page::11]
图表23、24、25
- 因子挖掘流程图揭示了分割种群多轮迭代策略,以及训练/验证/测试集划分的时间逻辑,说明了数据预处理和模型训练的系统性,确保结果不会出现未来函数偏差。[page::12][page::13]
图表27 - 29
- 多因子合成流程图及模型净值走势图和业绩统计表清晰展现了综合因子构造方法和最终模型强劲表现,特别是年化25%+的超额收益率和较佳夏普率,论证了方法论的实用价值。[page::14]
图表30、31
- 单目标遗传规划消融实验净值对比图形象体现出单目标模型的弱势,凸显双目标设计的必要性与优势。[page::15]
图表32 - 39
- 各重训练日挖掘出的前十名因子列表与训练指标展示,表明优秀因子以时序切割与成交额变量为核心,回测验证p值均满足失效检验,证明模型筛选的因子稳定有效,且因子表达式多样,验证了双目标策略保持种群多样性的成效。[page::17 - page::19]
---
四、估值分析
本报告的核心并不涉及传统的企业估值方法,而是应用机器学习和进化算法在行业轮动策略构建中的有效性验证。从回测绩效、夏普率、回撤和换手率等风险调整收益指标作为策略“估值”表现,证明策略优越性。双目标遗传规划的核心优势在于引入双目标评价指标与NSGA-II非支配排序实现多目标最优解的平衡,保证因子特征多样性和实战效率,而非单纯的财务估值模型。[page::0~15]
---
五、风险因素评估
报告明确提醒以下风险:
- 遗传规划因子基于历史数据的滚动窗口挖掘,模式可能因市场环境变化而失效,应关注规律时效性;
- 月频与周频轮动模型各有适用的市场条件,非万能盈利工具,超额收益不保证;
- 行业轮动策略不构成特定投资建议,涉及的行业并非投资指引,投资者应审慎理性决策;
- 双目标遗传规划仍存在因子结果随机性,确切可复现性尚待提高,如随机种子控制局限;
- 算子设计存在改进空间,如限制不合理表达式,及引入更多多样化输入变量。
这些风险提示展示了研究的客观谨慎,提醒策略应用需结合实际、持续跟踪。 [page::0][page::15][page::16]
---
六、批判性视角与细微差别
- 本文的双目标遗传规划通过|IC|和NDCG@k两个目标极大增强了因子挖掘的效果和多样性,然而其优越性更多体现在市场轮动因子开发的特定背景下,尚缺乏其他资产类别或纯选股模型场景的广泛验证;
- 对于NDCG@k的设置k=5固定值,尚未展开多参数敏感性讨论,模型表现是否对k值敏感存在未知数;
- 算子函数设计中包括大量数学和时序转化,容易导致表达式复杂且不易直观解释, 这可能影响因子透明度和实操接受度;
- 尽管将初始种群分割降低拥挤风险,但并未提及各小种群之间的交流融合策略,可能限制全局最优因子的发现;
- 算法运行效率虽然对硬件要求不高,但仍需多终端并行运行加速,实际部署可能存在复杂性;
- 报告虽多次强调因子稳定性与失效检验措施,但因子失效的前瞻性预警机制尚未建立,存在因子失效带来策略回撤风险。
总结来看,报告自洽且技术扎实,但未来跨场景的严苛验证、多样性强化机制及可解释性提升方向依然值得关注。[page::15]
---
七、结论性综合
华泰证券本报告聚焦行业轮动策略的创新性因子挖掘技术,针对近年来市场主线弱化和行业轮动加速的投资环境挑战,系统提出并验证了双目标遗传规划模型。该模型兼顾因子单调性(|IC|)和多头组表现(NDCG@k)双指标,在保证因子多样性、防止种群拥挤的同时,通过NSGA-II进化算法高效挖掘表达能力强的量价因子组合。报告通过系统的实证分析证明该策略在2022年9月至2024年4月间实现了25.74%的年化超额收益,夏普比率达到1.70,回撤控制良好且换手率适中,显著优于传统月频模型及单目标遗传规划策略。
图表呈现方面,报告清晰使用净值累计图、市场主线指标趋势图,及因子组合与性能指标表,全面展示了策略构建流程和实际效果;附录列举了各重训练节点优秀因子表达式和性能指标,为策略透明度和复现提供支撑。
报告强调,虽双目标遗传规划在行业轮动领域展现出巨大潜力,但仍需不断优化算子设计、提升因子稳定性控制、加强跨市场及跨资产验证,以及关注因子失效风险管理。整体而言,本研究不仅推进了行业轮动模型调仓频率的前瞻探索,也为量价因子挖掘提供了创新路径,为投资智能化升级贡献了坚实的研究成果。[page::0][page::14][page::15][page::17]
---
附加图表示例链接
- 双目标遗传规划周频行业轮动净值图示

- 遗传规划周频行业轮动模型累积净值走势图

- 市场主线强弱指标及超额收益相关图

- 双目标遗传规划流程对比示意

- 多因子合成策略流程

---
(全文分析共计约2000字)