`

【广发金工】AlphaForge:基于梯度下降的因子挖掘

创建于 更新于

摘要

本报告介绍了一种创新公式化Alpha因子挖掘框架AlphaForge,该框架基于连续可导的生成器和预测器结构,使用梯度下降优化投资因子。研究显示,AlphaForge生成的因子在多样化及稳定性方面表现优异,100个因子IC均值达到4.24%,组合因子IC均值峰值达13.85%,指数组合策略年化超额收益率普遍超过9%,中证1000组合表现尤为突出,显示出该方法在多层次市场的应用潜力及风险控制能力[page::0][page::1][page::5][page::13][page::17][page::22][page::25]。

速读内容

  • 研究背景与方法论概述 [page::0][page::1][page::2]

- 传统因子挖掘方法包括遗传规划、OpenFE和AlphaGen,均存在优化方向缺失或训练效率低、易过拟合等问题。
- AlphaForge提出了基于梯度下降的因子挖掘框架,通过连续可导的生成器(基于DCGAN和Masker)和预测器实现因子生成与性能预测。
- 因子以逆波兰表达式形式表示,保证表达的可计算性和计算效率。
  • AlphaForge框架结构与核心技术 [page::5][page::8][page::9][page::10]

- 生成器输入为正态分布随机噪声,经过线性层和逆卷积形成因子动作矩阵,Masker确保生成有效合法的因子表达式。
- 预测器为卷积神经网络,输入因子表达的独热编码,输出因子IC得分,学习因子表达与绩效的映射。
- 采用联合训练,迭代优化生成器以不断产生低相关且高得分的因子。
  • 超参数设置及训练特征 [page::11][page::12][page::13]

- 使用8年训练期的滚动训练,采用全A股池,训练周期1-10小时不等,显存需求24-32GB。
- 因子相关性上设置阈值0.7,避免因子冗余。
  • AlphaForge单因子性能表现 [page::13][page::14][page::15]

- 100个测试因子IC均值4.24%,最高7.10%,最低2.29%,ICIR均值0.42,因子截面相关性9.31%,时序相关性18.57%,指标均显示因子具备较好稳定性和独立性。



- 因子表达长度多分布在2至20之间,接近20的因子占比较高,因子可解释性较低,适用于自动化批量挖掘。
  • 因子合成方法及综合表现 [page::15][page::16][page::17]

- 使用LGBM模型与等权加权法分别对单因子合成,发现两者IC均值分别达到11.68%和13.29%,多头年化超额收益分别12.88%与16.58%,夏普比率和最大回撤表现优良。
- 组合进一步将两种合成策略结果等权合并,提升IC均值至13.85%,年化超额收益率达到17.33%,最大超额回撤仅为-5.41%。

  • 因子在不同主要指数股票池表现 [page::17][page::18][page::19]

- 在沪深300股票池IC均值6%-9%,年化超额收益率9.28%,超额最大回撤-7.25%,信息比率1.90。


- 中证500股票池IC均值9.36%,年化超额收益率10.98%,最大超额回撤-10.65%。


- 中证1000股票池IC均值12.43%,年化超额收益率14.28%,最大超额回撤-10.96%,信息比率2.27。

  • 换手率及风格曝光分析 [page::19][page::20]

- AlphaForge因子月度双边换手率低于传统AGRU因子,尤其多头部分,表明具有较强的持续性。
- 与Barra CNE6风格因子相关性较低,但在小市值、非流动性和低波动风险因子上存在负相关暴露。
  • 指数增强策略设计与回测结果 [page::21][page::22][page::23][page::24]

- 采用均值-方差优化限制跟踪误差及个股、市值、行业风格偏离,有效控制组合波动。
- 回测显示沪深300指增策略年化超额收益9.28%,最大超额回撤-7.25%,信息比率1.90。

- 中证500指增策略年化超额收益10.98%,最大超额回撤-10.65%。

- 中证1000指增策略年化超额收益14.28%,最大超额回撤-10.96%,信息比率2.27。
  • 风险提示 [page::1][page::25]

- 模型基于历史数据统计,市场环境和政策变化可能导致策略失效。
- 交易成本变化及市场结构变化可能引致策略收益下降或亏损。

深度阅读

【广发金工】AlphaForge:基于梯度下降的因子挖掘 — 全面深度分析报告



---

一、元数据与概览


  • 报告标题:《【广发金工】AlphaForge:基于梯度下降的因子挖掘》

- 作者与机构
- 原创者:安宁宁,广发证券首席金融工程分析师(SAC:S0260512020003)
- 团队成员:资深金工分析师陈原文(SAC:S0260517080003)、王小康(SAC:S0260525020002)
- 机构:广发证券,广发金融工程研究团队
  • 发布时间:2025年4月30日 10:21

- 主题:介绍并评估基于深度学习的全新公式化Alpha因子挖掘框架AlphaForge,讨论其方法论、实现机制、因子表现及策略应用,尤其是在梯度下降条件下优化因子挖掘的核心优势。
  • 核心论点总结

该报告旨在阐述AlphaForge因子挖掘框架,该框架通过生成器(基于生成对抗网络DCGAN)与预测器(卷积神经网络)构建连续可导的因子生成体系,实现因子公式挖掘的梯度下降优化。与传统遗传规划、OpenFE及强化学习方法相比,AlphaForge有效提高了挖掘效率与优化方向性,缓解了过拟合问题。实际样本外测试显示AlphaForge因子表现优异,构建的指增策略实现了显著的超额收益和稳健的回撤控制。整体上,报告展现出该框架在量化因子自动化挖掘领域的创新性优势及良好应用潜力。[page::0,1,2,4,25]

---

二、逐节深度解读



1. 引言与背景介绍


  • 报告开篇指出,因子挖掘中构造丰富、公式化的特征至关重要,传统以神经网络编码为主但容易缺乏明确的公式变量输入。AlphaForge解决了原有方法存在的超参数敏感度高、过拟合风险大、无法方向性优化等难题。

- 传统方案遗传规划(GP)、OpenFE及AlphaGen均存在计算效率、优化方向等弱点,例如:
- GP通过模拟自然选择机制自动生成特征,但随机性大,训练耗时长且易过拟合。
- OpenFE使用特征扩张后缩减策略,一次性生成大量因子然后筛选,操作复杂且难以深入挖掘复杂高阶特征。
- AlphaGen利用强化学习优化因子生成序列,虽然提升优化方向性但训练时间长,结果对超参数依赖显著。
  • AlphaForge由Shi等人提出,结合生成对抗网络和卷积网络,创新地使生成结构连续可导,实现梯度下降优化。整体设计提升了训练效率及因子质量。[page::0,1,2,3,4]


2. AlphaForge框架细节


  • 架构由两大部分:生成器和预测器。

- 生成器:
- 采用DCGAN架构,输入为形状为(Seqlen, Latentsize)的正态分布噪声。
- 经过线性变换+多层转置卷积(Deconv)和常规卷积叠加,输出(batchsize, Seqlen, Action_size)因子动作张量。
- 输出经过Masker层,Masker对无效操作进行屏蔽,保证因子表达式逻辑合法(符合逆波兰表达式规则),并最终转为one-hot编码的合法表达式矩阵。
- 该“Mask+Gumbel Softmax”设计保障了模型连续可导且可进行梯度下降。
  • 预测器:

- 输入为因子表达动作的独热编码。
- 采用多层卷积+池化+线性层结构,预测IC得分(因子质量指标)。
- 能快速学习表达式与IC之间的映射,为生成器提供优化目标。
  • 损失函数设计特别引入两组因子生成的相关性惩罚,防止生成器陷入过度拟合单一因子导致局部极值。

- 因子公式采用逆波兰表达式(RPN),即算符置于操作数后,方便算法统一计算表达式及避免优先级歧义。

该设计通过自动微分框架,实现了基于梯度下降的“公式化Alpha因子”的高效挖掘。核心逻辑为训练生成器产出高预测器得分的因子表达式,预测器作为评价和引导梯度信号的中介。[page::5,6,7,8,9,10]

3. 因子构造及动作空间设计


  • 采用基础的日频量价数据(开盘、收盘、最高、最低价、成交量、VWAP),并结合一元、二元、截面和时序算子(如加减乘除、极值、求和、排名等)。

- 时序算子的参数回看天数(d)从5,10,20,40,60中挑选。
  • 这样设计的动作空间大小确定了因子表达式可能的组合复杂度,生成器在这个空间内生成候选因子。

- 逆波兰表达式使得复杂公式能够被序列化成规整的向量和矩阵形式,便于深度网络处理。
  • 生成器输出张量中,每个时间步对应位置上的one-hot决定了因子表达式当前位置的运算符或数值,经过mask后为有效路径。


此设计充分平衡了因子表达复杂度与可计算效率,对生成任务提供了合理的约束及连续导数结构。[page::6,7]

4. 实际训练过程及超参数


  • 采用滚动训练,每年重新训练,覆盖全A股股票池,训练期覆盖8年以上,以保证模型泛化和防止过拟合。

- 训练使用8年数据,因子生成器和预测器轮流训练优化,生成器生成复杂度上限为序列长度(例如20)。
  • 超参数设置固定,模型层数、通道数保持不变。

- 生成因子后剔除与已有因子相关系数超过0.7的,防止冗余。
  • 训练单次随机种子耗时约1-10小时,显存需求24-32GB,显示该方法对计算资源的较高要求。

- 随着时间推进,市场有效性提升,挖掘难度加大,训练轮数增加。

训练流程精准且较为严谨,有系统的防止高相关冗余因子发生,保证候选因子多样性与稳定性。[page::11,12,13]

5. 单因子表现分析


  • 样本外(out-of-sample)100个AlphaForge单因子表现分析:

- IC均值约4.24%,最高7.10%,最低2.29%,中位数4.34%。
- ICIR均值0.42,说明因子整体稳定性良好。
- 单因子相关性测算:截面相关性均值9.31%,时序相关性18.57%,表明因子相对独立,相关性低的设计得以实现。
  • 因子表达式长度分布:

- 长度分布广泛,主要集中在2-20之间,长因子占多数且多数已达到最大长度20。
- 说明模型倾向于探索复杂的因子公式,但复杂公式的可解释性较低。
  • 因子多样化和低相关性体现了该框架的挖掘能力及筛选机制的有效性。


图形展示(IC分布、相关性矩阵、表达式长度直方图)直观反映因子质量及多样性。[page::13,14,15]

6. 因子合成与策略表现


  • 因子合成采用两种方式:

- 等权合成(EW);
- 基于LGBM(梯度提升树)的机器学习合成,通过非线性模型赋权。
  • 合成效果:

- LGBM合成IC均值为11.68%,等权为13.29%;
- 低相关性使得两者合成后指标进一步提升,最终IC均值13.85%,多头年化超额收益率17.33%,回撤-5.41%。
  • 各大宽基指数的指增策略表现:

- 沪深300指增:超额收益9.28%,超额最大回撤-7.25%,信息比率1.90;
- 中证500指增:超额收益10.98%,超额最大回撤10.65%;
- 中证1000指增:超额收益14.28%,超额最大回撤-10.96%,信息比率2.27。
  • 多指数表现表明AlphaForge合成因子在大、中、小盘中的适用性,中小盘组表现更优,策略稳定性较好。

- 策略采用马科维茨均值-方差组合优化,限制跟踪误差,控制行业及市值风格偏差,保证了风险收益的平衡。

换手率分析显示,多头换手率显著低于传统AGRU因子系列,体现AlphaForge因子天然的持续能力。因子与Barra风格因子的相关性较低,主要风格暴露在小市值、流动性风险上,说明AlphaForge发现了一些新的alpha来源。[page::15,16,17,18,19,20,21,22,23,24]

---

三、图表深度解读



图1:OpenFE框架概览(Page 3)
  • 展示特征扩张和特征缩减的流程中,数据集输入基础和分类特征,通过算子生成候选因子,利用FeatureBoost和评价机制进行筛选。

- 说明OpenFE一次性生成海量因子的方式,筛选过程采用分块和分阶段计算,有助于理解其优缺点。

图2:AlphaGen框架概览(Page 4)
  • Seq2Seq形式的强化学习生成因子表达式,输出导致因子组合模型表现变化,使用PPO优化。

- 展示非连续可微的动作采样机制,表明需要替代梯度优化的RL方案。

图3:AlphaForge框架概览(Page 5)
  • 直观表现生成器输出表达式与预测器估计IC的反复迭代过程,加上相关性惩罚跳出局部最优。

- 展示动态组合阶段的因子筛选过滤逻辑,形成最终“Mega-Alpha”。

图4:逆波兰表达式示例(Page 7)
  • 具体示例Sum(Add(5, Vol), 2d)的树状及序列编码,明示表达式在模型中的表达形式。


图5:生成器DCGAN架构(Page 8)
  • 线性层→逆卷积→卷积层套叠,LayerNorm/BN、ReLU激活详解其作用。

- 说明生成器如何从隐空间到因子动作三维张量转化。

图7:预测器模型结构(Page 10)
  • 2层卷积+池化+线性层逐步提取因子表达隐藏特征映射至IC估计。

- 突出预测器结构较简单、易训练的特点。

图9:100因子IC均值和ICIR分布(Page 13)
  • 条形图显示因子IC集中于3%-7%之间,ICIR也衡量了稳定性。

- 视觉展示使投资者直观感知因子质量。

图10、11:因子截面与时序相关性热图(Page 14)
  • 大部分两因子间相关系数接近零,呈现非相关性散布,减少同质化风险。

- 预示组合多样性的有效建立。

图12:因子表达长度分布(Page 15)
  • 集中于最大长度20,提示因子结构复杂度是挖掘性能的关键但可解释性薄弱。


图13:GBDT示意图(Page 16)
  • 说明因子合成时所使用的LGBM模型原理,集成多弱学习器提升性能。


图14、15:合成因子多空净值及超额净值曲线(Page 17)
  • 多头收益持续上行,超额净值曲线稳健增长,说明合成因子有效提高了回报率。


图16、17:沪深300池多空净值及超额净值(Page 18)
  • 展示不同合成方法在沪深300的表现,强调等权合成稍优。


图18、19:中证500池多空及超额净值(Page 18)
  • 类似沪深300但收益波动略低,反映指数成份差异。


图20、21:中证1000池多空及超额净值(Page 19)
  • 最高表现,因数多样性带来中小盘更大Alpha空间。


图22~24:沪深300、中证500及中证1000指增策略净值曲线(Page 22,23,24)
  • 均表现出策略稳步增长,超额净值曲线和基准指数明显分离,说明AlphaForge因子在实际投资组合中的应用效果较好。


---

四、估值分析



本报告核心不涉及传统估值框架的内容,专注于Alpha因子的挖掘和策略表现。策略回测以超额收益率、最大回撤及信息比率等指标分析因子表现,结合因子相关性、换手率和风格暴露,提供对策略稳健性多角度评价,没有直接企业或资产估值模型使用。[page::16-24]

---

五、风险因素评估



报告明确指出风险提示:
  1. 市场环境变异风险

因使用历史数据建模,若市场政策或环境发生变化,前述模型及因子规律可能失效,造成策略收益波动或亏损。
  1. 交易成本及市场结构变化风险

在回测中一般默认较低成本,现实交易成本波动及市场结构演变可能导致策略表现下滑甚至亏损。

这些风险警示反映出量化模型对未来市场不确定性的固有限制,提醒投资者需要谨慎关注执行环境。[page::1,25]

---

六、批判性视角与细微差别


  • 算法创新与资源消耗的平衡

虽然AlphaForge创新地实现了因子生成的梯度下降优化,但单轮训练耗时长、显存需求高,提示实际应用需强大计算资源。算法复杂度高可能对小型量化团队构成门槛。
  • 因子复杂度与可解释性的矛盾

因子表达长度普遍较长且复杂,虽提升了因子效果,但模型“公式黑盒”特性加大了可解释性难度,可能限制机构对风控和策略调整的灵活性。
  • 超参数与过拟合

虽有相关性惩罚设计,但模型依然可能存在一定的过拟合风险,特别是在静态策略框架中,市场有效性增强会加大挖掘难度,训练周期明显延长表明效果递减。
  • LGBM合成性能挑战

报告指出LGBM虽复杂却未明显胜过等权合成,暗示基于现有100因子的结构已较为完善,或者因缺乏更高层次的特征工程,机器学习模型提升有限。
  • 策略表现指标中,部分回撤相对较高

例如中证1000最大回撤近11%,风险监控需进一步完善。
  • 细节上,策略组合超额回撤标记“最大回撤”及“超额最大回撤”时,报告中略有混淆,需要明确区分。[page::12,13,25]


---

七、结论性综合



广发金工的本篇报告详细介绍了一种基于生成对抗网络与卷积网络组合的公式化Alpha因子自动挖掘框架——AlphaForge。该框架在传统遗传规划、OpenFE和强化学习基础上,引入连续可导性和梯度下降的优化机制,提升了因子挖掘效率和性能表现。  

具体而言,AlphaForge引入的生成器(基于DCGAN)和预测器(卷积神经网络)配合Gumbel Softmax和Masker层,实现了因子表达式的可微分转换,为因子得分优化带来了方向性和效率保证。通过逆波兰表达式编码,算法在日频量价基础算子空间内自动生成多样且低相关性的高绩效因子。

实验与回测部分,滚动数据训练验证了因子在全A股及沪深300、中证500、中证1000等主要股票池的稳健表现,单因子IC均值相对较好(4.24%),合成因子IC均值13.85%,多头年化超额收益最高达17.33%,且合成策略的信息比率达到2.27,超额回撤控制良好。

策略的多指数实战效果验证了该因子体系在不同规模与风格股票池中的适用性,表现尤其强劲于中小盘指数。因子低相关性、合理换手率及低风格因子相关的特性,进一步增强了策略的独立alpha贡献。

报告全方位揭示了AlphaForge挖掘体系的创新意义、实践性能及应用潜力,并明确提示市场环境变化和交易成本上升对策略表现的潜在负面影响。整体而言,AlphaForge提供了一种梯度优化时代背景下高效公式化因子自动挖掘的全新解决方案,具备较强的研究和应用价值。

---

主要图表引用


  • 图1、2、3 (OpenFE、AlphaGen、AlphaForge框架图)【page::3-5】

- 图4(逆波兰表达式示例)【page::7】
  • 图5(生成器DCGAN架构)【page::8】

- 图7(预测器模型结构)【page::10】
  • 图9(因子IC分布)【page::13】

- 图10、11(因子相关性热图)【page::14】
  • 图12(因子长度分布)【page::15】

- 图13(GBDT示意)【page::16】
  • 图14、15(合成因子净值曲线)【page::17】

- 图16-21(多指数池多空净值及超额净值)【page::18-19】
  • 图22-24(指增策略净值)【page::22-24】


---

结语



本报告以牢靠的数据和层次分明的框架系统,展现了AlphaForge框架的技术原创力与应用实践价值。投资者和研究人员可参考该框架,结合自身计算资源和业务场景,实现Alpha因子挖掘的自动化和持续优化,拓展量化策略的Alpha源泉。

----

报告引用均带有[page::页码]标识,方便溯源校验。

报告