AlphaNet 改进:结构和损失函数
创建于 更新于
摘要
报告提出对AlphaNet深度学习股票因子挖掘模型的三大改进:特征提取层自定义Dropout机制以降低计算开销并防止过拟合;损失函数加入中性化机制以剔除Barra风格因子暴露,挖掘更纯粹Alpha因子;提高多头样本权重以增强多头收益能力。各项改进均在中证500增强策略回测中实现收益稳健提升及风险控制改善,且具有较好的模型泛化性与易用性 [page::0][page::5][page::6][page::10][page::13][page::15][page::16]
速读内容
- 三种AlphaNet改进方法描述与效果总览 [page::0][page::3][page::16]
- (1) 自定义Dropout机制节约计算开销,控制过拟合并提升训练速度。
- (2) 损失函数加入中性化机制,降低风格因子暴露,挖掘更纯正Alpha。
- (3) 损失函数提高多头样本权重,挖掘显著多头收益的因子。

- 特征提取层自定义 Dropout机制详解及效果 [page::4][page::5][page::9][page::10][page::11]
- 该机制对二元运算函数(如tscorr)采用抽样遍历,选取n=8覆盖95%以上特征组合,降低O(n²)复杂度。
- 降低特征之间相关性,有助于防止过拟合,提高模型泛化。
- 该机制较传统Dropout更节约计算资源且具更好控制性。
- 单因子IC表现上,AlphaNet-v2.1与基线AlphaNet-v2相近,分层测试TOP组合收益率略高,信息比率略低。
- 中证500增强策略回测中,AlphaNet-v2.1实现年化超额收益21.5%,信息比率3.3,均优于基线模型。





- 损失函数加入中性化机制,挖掘增量Alpha能力 [page::5][page::12][page::13]
- 将Barra十大风格因子中性化加入损失函数,通过回归残差计算MSE,实现降低因子与风格暴露相关性。
- 损失函数中性化后,RankIC均值有所下降(7.99%),但ICIR提升至1.15,反映因子稳定性增强且控制了风格风险。
- 分层收益测试显示,TOP组合超额收益及信息比率均显著改善,且最大回撤和波动率明显下降。
- 中证500增强策略回测年化超额收益率略低于基线,但策略稳定性指标和风险控制更优。




- 损失函数提高多头样本权重,增强多头收益挖掘 [page::6][page::14][page::15]
- 对训练数据中收益排名前50%样本权重调为2,后50%样本权重调为1,引导模型更重视多头收益样本。
- AlphaNet-v2.3在RankIC均值(11.7%)和TOP组合收益率上均优于基线模型,信息比率略低于基线。
- 中证500增强策略中,AlphaNet-v2.3实现年化超额收益22.12%,信息比率3.31,明显优于基线。
- 该方法简单有效,无需修改模型底层代码,具有较强适用性。




- 附录:Barra 风格因子模型介绍 [page::17]
| 大类 | 子类 | 因子简要描述 | 因子权重 |
|----------------|-------|-------------------------------------|---------|
| Size | LNCAP | 股票总市值的自然对数 | 1 |
| Beta | BETA | 股票收益率对中证全指收益率的线性回归斜率 | 1 |
| Momentum | RSTR | 历史收益率均值、指数加权 | 1 |
| Residual Volatility | DASTD | 历史波动率,指数加权 | 0.74 |
| | CMRA | 历史收益率波动幅度 | 0.16 |
| | HSIGMA| 线性回归残差项标准差 | 0.10 |
| Non-linear Size| NLSIZE| Size的三次方对Size因子的正交增量 | 1 |
| BooktoPrice | BTOP | 企业总权益值与当前市值比值 | 1 |
| Liquidity | STOM | 过去一个月流动性 | 0.35 |
| | STOQ | 过去一个季度流动性 | 0.35 |
| | STOA | 过去一年流动性 | 0.30 |
| Earning Yield | ETOP | 过去12个月市盈率 | 0.66 |
| | CETOP | 过去12个月经营性净现金流与市值比值 | 0.34 |
| Growth | EGRO | 过去5年归母净利润复合增长率 | 0.34 |
| Leverage | MLEV | 市场杠杆 | 0.38 |
| | DTOA | 资产负债率 | 0.35 |
| | BLEV | 账面杠杆 | 0.27 |
资料来源:USE4,华泰研究
深度阅读
AlphaNet 改进:结构和损失函数 详尽深度分析报告
---
一、元数据与概览
- 报告标题: AlphaNet 改进:结构和损失函数
- 作者/发布机构: 华泰证券研究所,研究员林晓明、李子钰、何康
- 发布日期: 2021年7月4日
- 研究主题: 因子挖掘神经网络AlphaNet的三个改进方向及测试结果
- 报告核心论点:
本文在前期AlphaNet模型基础上,提出三种核心改进:(1) 特征提取层自定义Dropout机制;(2) 损失函数中加入因子中性化机制;(3) 损失函数中特别提高多头样本权重。三项改进均经过实证测试,均对模型性能带来积极影响。
- 作者传达的主要信息: 深度学习模型在因子挖掘选股领域具备高度灵活性,针对AlphaNet模型的结构和损失函数的定制优化能够有效提升模型的稳定性、收益率及计算效率,且部分改进措施具备通用性,能被其他神经网络选股模型借鉴应用。
---
二、逐节深度解读
2.1 引言与研究背景(第一页)
报告回顾了AlphaNet模型的开发历史,明确其作为端到端的因子挖掘和因子合成模型的定位,基于深度学习的灵活性和强大拟合能力,提出三大改进方向,分别针对模型的结构优化(Dropout机制)和损失函数的调整,并陈述了各自的预期优势和实测收益改善。[page::0]
---
2.2 研究导读和结构框架(第三页)
通过图表1,展示了AlphaNet在多因子选股体系中的定位。AlphaNet作为深度学习模型,连接因子生成与多因子合成阶段,区别于传统线性回归和机器学习方法,如XGBoost。后续图表2明确提出三个研究改进方向。一方面体现了深度学习方法在因子挖掘上的创新潜力,另一方面为后文详细展开三种改进方法的技术细节及测试结果提供框架。[page::3]
---
2.3 特征提取层自定义 Dropout 机制(第四至五页)
论点总结
- 传统Dropout通过随机丢弃神经元激活来防止过拟合,节约参数使用。
- 由于AlphaNet在特征提取层使用大量二元运算函数(如时间序列相关系数tscorr),计算复杂度为$O(n^2)$,导致计算开销大且特征间相关性高。
- 采纳Dropout思想,设计自定义“抽样遍历”机制:随机抽取部分特征(抽样后进行两两组合计算),将全部$C
关键数据点
- 原始特征数量15个,全部两两组合需105次计算。
- 通过模拟1000次(每次随机抽样n个特征)测试覆盖率,选择n=8时,10模型集成覆盖95%以上特征组合,计算量降至28($C8^2$),大幅提升效率。
- 优势三点:节省计算开销允许输入更多原始特征、控制过拟合、增强模型多样性利于集成。
- 相较直接Keras Dropout,自定义Dropout更具计算优势和模型可控性。
概念解析
自定义Dropout并非简单丢弃通道,而是在“输入特征空间”随机子集抽样,降低计算负担和交叉特征冗余,兼顾过拟合控制和效率,是对传统Dropout的创新适用。[page::4-5]
---
2.4 损失函数加入中性化机制(第五至六页)
论点总结
- 传统MSE损失未剔除因子对已知风格因子的依赖,训练模型往往追随已有因子,缺乏增量Alpha。
- 设计中性化机制:预测收益$\hat{y}$先对Barra风格因子回归,使用残差部分$\hat{y}{res}$计算MSE损失,迫使模型挖掘与主流风格因子低相关的因子。
- Barra风格因子包括市值、价值、动量、波动率、杠杆等共10类。
数据点及结论
- 加入中性化后AlphaNet的超额收益下降,但模型整体稳定性、对回撤控制明显改善,尤其在2014年底、2019年初、2020年初关键回撤期表现突出。
- 该方法不仅限于AlphaNet,具备广泛模型适用性。
关键概念解读
中性化机制通过损失函数层面的约束,保证模型预测因子与已知风格因子正交,从而提升选股模型的纯Alpha捕捉能力,避免重复暴露于风格风险而提升策略的风险调整收益。[page::5-6]
---
2.5 损失函数中提高多头样本权重(第六页)
核心思路
- A股市场做空受限,多头因子尤为重要。
- 修改损失函数样本权重机制,将收益排名前50%的多头样本权重设置为2,后50%设置为1,模型训练时更关注多头表现,优化其预测准确性。
- 该方案无需底层代码改动,简单易行,对其他神经网络模型同样适用。
公式说明
损失函数为加权求和:$\mathrm{Loss}=\sumi wi L(yi, \hat{y}i)$,通过调整$wi$提升多头样本权重。[page::6]
---
2.6 测试流程及基线模型说明(第七至八页)
- 以AlphaNet-v2作为基线模型,基线模型采集全A股剔除特定股票,使用包括开、高、低、收、成交量、加权价等15个维度特征,构造$15\times30$数据输入。
- 回测期为2011年1月31日至2021年6月30日,训练数据使用过去1500日滚动窗口,4:1划分训练验证集。
- 训练10个模型、等权集成减少随机性干扰。
- 三个改进模型分别对应上述改动:v2.1抽样Dropout、v2.2中性化损失、v2.3多头样本权重。
---
2.7 三种改进方向详细测试结果解析
2.7.1 特征提取层自定义Dropout机制(第九至十一页)
- 单因子IC测试:
AlphaNet-v2.1 RankIC均值11.45%,略优于v2的11.25%;稳定性微弱下降(IC标准差略高);ICIC略逊。综合表现相近但略有提升。
- 累计RankIC曲线(图表10)显示AlphaNet-v2.1收益率略高于v2,体现了细微但持续的改进。
- 分层测试:
TOP分层年化超额收益率略高(15.79%对15.03%),TOP组合信息比率和胜率略低,整体效果相近。
- 行业市值中性中证500增强策略回测:
年化超额收益21.5%,高于v2的20.13%;信息比率和Calmar比率也更优,最大回撤略小。
- 年化收益逐年回测及超额收益回撤表现上,v2.1在多个年份表现更优,回撤更小。
- 整体评价:自定义Dropout提升训练速度,降低计算开销,有效控制过拟合,且带来小幅的性能提升。[page::9-11]
2.7.2 损失函数加入中性化机制(第十二至十三页)
- 单因子IC测试显示:
v2.2 RankIC均值降至7.99%,标准差6.96%,但ICIR提升至1.15(优于v2的1.14),说明去除风格因子暴露后预测更稳定、信号更纯。
- 累计RankIC曲线(图表18)显示v2.2曲线低于v2,回报减少,但稳定性改善。
- 分层测试:
TOP组合超额收益率较v2略低(10.79%对15.03%),但信息比率更高,反映更稳定的收益信号。
- 中证500增强策略回测:
年化超额收益率和夏普比率下降,但超额收益最大回撤和Calmar比率显著改善,表现出更优的风险调整能力。
- 回撤图表显示2014、2019及2020年回撤显著降低。
- 总结:加入中性化损失使模型剔除风格因子依赖,获得更纯Alpha,但收益绝对值下降,胜在稳定性和风险控制,是一种权衡风险收益的优秀改进手段。[page::12-13]
2.7.3 损失函数中提高多头样本权重(第十四至十五页)
- 单因子IC测试显示:
v2.3 RankIC均值11.7%,较v2的11.25%略有提升,ICIR略低,整体表现相近。
- 累计RankIC曲线(图表26)显示v2.3优于v2,持续跑赢。
- 分层测试:
TOP组合年化超额收益率16.9%,明显高于v2的15.03%,TOP组合信息比率也有提升。
- 中证500增强策略回测:
年化超额收益22.12%,信息比率3.31,均优于v2,表明提升多头样本权重有效挖掘多头收益。
- 年化收益分年表现亦较优,超额收益累计曲线保持领先(图表32)。
- 该方法简单易行,无需底层代码修改,适合其它神经网络模型应用推广。[page::14-15]
---
三、图表深度解读
图表0(首页图)
- 展示三种改进模型(改进1:Dropout,改进2:中性化,改进3:多头样本权重)相对于基线模型AlphaNet-v2,在中证500基准上的累积超额收益对比。
- 结果显示,改进1和改进3的累计超额收益领先于基线,改进2则相对较弱,映射出前文关于收益与风险之间的权衡效应。[page::0]
图表1与图表2(研究导读部分,第三页)
- 图表1阐释多因子选股体系中AlphaNet的定位,展示传统因子生成、多因子合成与深度学习模型的连接,突出AlphaNet的端到端因子挖掘优势。
- 图表2以流程图形式列举三大改进方向,直观展示技术路线。[page::3]
图表3与图表4(Dropout机制,第四页)
- 图表3类比传统神经网络Dropout示意图,帮助读者理解Dropout通过稀疏连接控制过拟合的基本原理。
- 图表4展示了自定义Dropout在时间序列相关性计算中随机采样特征的机制,视觉化呈现随机抽样减少组合特征数,降低计算负担。[page::4]
图表5(抽样覆盖率模拟,五页)
- 表格列出不同抽样特征数量(n)对应覆盖两两组合比例;n=8时达到95%以上覆盖率,是设计选择的关键数据依据。
- 明确了模拟次数1000、模型数量10,支持理性选择特征子集大小,保证模型集成的特征多样性。[page::5]
图表9-16(Dropout机制测试结果,九至十一页)
- 图表9反映RankIC等单因子统计指标,显示两个模型排名差异微小。
- 图表10累计RankIC曲线展现成长性趋势,v2.1稍优于v2。
- 图表11分层测试数据表明TOP层表现小幅提升,差异有限。
- 图表12、13分层收益和多空收益曲线显示更细致超额收益分布。
- 图表14中证500增强策略回测表明,基于自定义Dropout的模型在年化收益、信息比率等指标均有提升。
- 图表15、16详细列出逐年收益和超额收益回撤情况,支撑该机制提升模型综合表现的结论。[page::9-11]
图表17-24(中性化机制测试结果,十二至十三页)
- 图表17表明RankIC均值下降但IC
- 图表18累计RankIC曲线较基线下降。
- 图表19、20分层测试收益与多空收益曲线反映信息比率提升,收益率减少。
- 图表21具体分层收益率列表。
- 图表22增强策略回测显示收益率下降但最大回撤和Calmar比率提升,风险控制显著。
- 图表23逐年收益情况及图表24回撤变化直观显示稳定性获益。
整体表明因子中性化机制有效优化组合风险特性。[page::12-13]
图表25-32(多头样本权重测试结果,十四至十五页)
- 图表25-26显示略高IC均值及累积IC优势。
- 图表27-29呈现分层测试超额收益及多空组合夏普提升。
- 图表30增强组合回测全指标优于基线,收益稳健。
- 图表31-32分别为逐年收益及累计超额收益回撤图,持续领先基准模型。
- 体现通过样本权重调整,有效挖掘多头因子收益潜力。[page::14-15]
图表33(Barra风格因子模型,十七页)
- 详细列明Barra USE4十大风格因子及权重:市值、Beta、动量、残差波动率、非线性Size、市净率、流动性、收益率、增长、杠杆等。
- 作为因子中性化机制的中性因素来源,具备代表性和完整性。[page::17]
---
四、估值分析
报告并无涉及具体市值估值、目标股价或传统财务估值模型(如DCF、PE、EV/EBITDA等)的分析内容,聚焦于AlphaNet模型架构和性能提升,故无相关估值分析。
---
五、风险因素评估
- 历史经验总结的AI模型存在失效风险,市场环境变化或模型假设不符可能导致策略失效。
- 神经网络黑箱性质,较低可解释性,对异常行情难以预判。
- 随机性较大,结果波动显著,需要多模型集成降低风险,谨慎使用。
- 科技手段依赖带来的技术和实现风险。
- 报告未提供明确风险缓解策略,但通过模型集成、验证回测、样本加权调节等方式间接降低风险。
---
六、批判性视角与细微差别
- 三个改进措施存在“收益-风险”的权衡现象,尤其中性化机制确实带来收益率下降,使用时需权衡实际需求。
- 模型稳定性提升尚需在更长周期和不同市场阶段验证,部分结果表现也较为温和。
- 报告多依赖历史回测,未来真实表现存在不确定性,尤其AI模型样本外泛化能力未充分展示。
- 文中对抽样Dropout机制的设计细节仍需进一步技术披露,例如随机性对最终训练效果的影响,及是否存在最佳抽样策略。
- 多头样本权重提升简单有效,但对空头样本预测能力的忽视可能导致风险控制不足。
---
七、结论性综合
本报告针对AlphaNet因子挖掘神经网络,提出了三项关键改进,并均实现了较为理想的效果:
- 特征提取层自定义Dropout机制通过随机抽样减少二元运算组合,显著降低计算成本,允许更多原始特征输入,减弱特征间相关性,控制过拟合。实测中带来了模型收益轻微提升及训练时间大幅缩短,有利于模型复杂度提升和实用性增强。[page::0,4-5,9-11]
- 损失函数中加入中性化机制,以Barra十大风格因子进行预测值中性化,使模型挖掘更纯粹的Alpha信号。尽管绝对超额收益有所下滑,但策略的稳定性、回撤控制和风险调整表现明显改善。这种方法设计独特,适用范围广,值得在各类因子模型中推广应用。[page::0,5-6,12-13]
- 损失函数中提高多头样本权重旨在应对中国市场做空空间受限的特点,帮助模型识别更具正向收益潜力的多头因子。测试表明此简单调节提升了模型的TOP组合收益率和信息比率,增强了组合的超额表现,且无需深层次网络改造,易于实现和推广。[page::0,6,14-15]
整体三项改进针对AlphaNet模型的不同方面进行了有效优化,既有计算效率与结构创新,也有损失函数层面对信号本质的提升,实现了多维度的性能改进。通过丰富的数据回测和图表呈现,报告深入展示了每个改进的优缺点与效果,充分体现了深度学习模型定制优化在智能选股领域的潜力和挑战。
---
重要图表摘录(部分)
-

-

-

-

-

-

-

---
综上,报告深刻剖析AlphaNet三项针对性改进设计与实际应用效果,为智能选股模型的优化提供了有力实证和理论依据,显示出深度学习在量化投资领域的广阔前景,且对进一步研究和实务应用均有重要指导价值。[page::16]
---
免责声明
华泰证券特别强调,AI模型选股策略基于历史数据和经验总结,存在失效风险,且模型较难解释,需谨慎使用。投资决策应结合多元信息,避免完全依赖单一模型。
---
(全文引用页码标注均已附在括号尾部,以便溯源。)