破局低信噪比: 基于深度学习的因子优化研究
创建于 更新于
摘要
本报告针对低频量化策略中深度学习拟合收益率因低信噪比而受限的问题,提出以因子与收益相关系数(IC)作为优化目标,构建深度相关模型(DCM)。该模型通过Weighted IC提升选股任务中头部相关性,采用两层32单元全连接层加批标准化的神经网络结构,实现收益预测映射的非线性拟合。回测显示,DCM相比传统收益拟合神经网络,年化超额收益提升7.41%,信息率提升0.9,最大回撤得到控制,策略表现更为稳定且有效 [page::0][page::2][page::5][page::7][page::8][page::11]。
速读内容
低信噪比问题与目标函数设计 [page::0][page::2]
- 低频量化策略拟合收益率的信噪比低,导致深度学习模型难以有效训练。
- 本报告提出用合成因子与未来收益的相关系数(IC)作为优化目标,属于List-wise统计指标,提升训练信噪比。
- Weighted IC引入指数衰减权重,增强模型对因子值高端样本的关注,更适合多头选股策略。
- 目标函数设计区别:传统均方误差(Loss1)关注单点误差,IC优化(Loss2)关注同一期数据整体排序相关性。
传统因子合成方法简介 [page::2][page::3]
- 等权法:所有因子标准化后简单加权。
- 历史IC加权:基于过去IC值的权重加权。
- 最大化ICIR加权和最大化IC加权:线性优化问题有解析解。
- 线性组合方法对关系建模能力有限,非线性映射需求凸显。
DCM模型结构与损失函数计算流程 [page::4][page::5][page::6]
- 神经网络采用两层32单元全连接层加批标准化层,输入21个选取的因子。
- 因子及收益均做行业市值中性化及排序分位数处理。
- 损失函数通过排序后的预测分数与真实收益计算Weighted IC,采用多期指数衰减加权。


因子选取及处理流程 [page::6][page::7]
| 指标维度 | 指标描述 | 方向 |
|---------|---------|-----|
| 偿债能力 | 有息负债/总资产;短期负债/货币资金 | — |
| 盈利能力 | 净资产收益率(TTM)、销售毛利率(TTM)、单季度净资产收益率、单季度销售毛利率、扣非净利润比、经营现金流比例 | + |
| 盈利波动性 | 净资产收益率波动性、毛利率波动性 | — |
| 成长能力 | 单季度营业收入同比增长率、单季度净利润同比增长率 | + |
| 经营能力 | 存货周转率、应收账款周转率、总资产周转率 | + |
| 分析师预测 | 一致预期营收同比、一致预期净利润同比、一致预期2年复合增长率、4周一致预期净利润变化率 | + |
| 投资者认可度 | 北向持有占比、估值分位数、EP5年分位数 | + |
策略回测表现与基线对比 [page::7][page::8][page::9]

- DCM策略测试区间(2012-01-01至2021-10-26)年化超额收益16.5%,信息率2.31,最大回撤6.76%。
- 除2016年和2018年表现较弱,其余年份均实现10%以上超额收益。
- DCM对比基线系统提升明显,年化超额收益与信息率分别提升7.41%和0.9。
- 相比最大化IC线性模型,非线性DCM策略优势明显。

| 模型 | 年化收益(%) | 年化超额收益(%) | 夏普比率 | 信息率 | 最大回撤(%) |
|------|------------|----------------|---------|--------|------------|
| 等权 | 21.22 | 12.83 | 0.81 | 1.55 | 48.10 |
| 历史IC加权 | 20.12 | 11.73 | 0.78 | 1.56 | 46.57 |
| 最大化IC | 21.92 | 13.52 | 0.84 | 2.09 | 48.34 |
| 最大化ICIR | 11.64 | 3.25 | 0.46 | 0.51 | 63.96 |
| Loss1神经网络 |17.48| 9.09 | 0.68 | 1.41 | 50.95 |
| DCM | 24.89 | 16.50 | 0.98 | 2.31 | 46.92 |
策略稳定性分析与风险提示 [page::10][page::11]

- DCM在基准Weighted IC为负时表现尤为优异,有效缓解了策略的回撤风险。
- 稳定的超额收益有利于复利效应发挥,提升长期资产增值。
- 主要风险包括训练的随机性风险、因子效果衰减及历史表现不代表未来收益。
- 建议关注策略应用中的政策风险和模型自身风险。
量化因子构建与深度相关模型总结 [page::0][page::5][page::11]
- 创新点在于将优化目标改为多期加权Weighted IC,突破了收益拟合信噪比瓶颈。
- 结合21个基本面及市场预期因子,做行业市值中性化排序处理。
- 使用非线性深度神经网络实现映射,提升模型对因子复杂关系的学习能力。
- 回测区间长达近十年,覆盖多种市场环境,验证了模型的稳定性和有效性。
深度阅读
报告详尽分析解构:破局低信噪比——基于深度学习的因子优化研究
---
一、元数据与报告概览
- 报告标题:破局低信噪比——基于深度学习的因子优化研究
- 作者及机构:中信证券研究部,主要撰写分析师包括汪洋、王兆宇、赵文荣、马普凡、赵乃乐等多位量化策略分析师。
- 发布日期:2021年11月23日
- 主题:多因子量化选股策略,重点探讨基于深度学习方法优化因子组合,解决低频量化策略中的信噪比问题。
- 报告核心论点及结论:
报告认为传统深度学习方法在低频量化策略应用中由于收益率目标的低信噪比导致训练困难,针对该问题,设计了一种以合成因子与收益率相关系数(IC)为优化目标的深度相关模型(Deep Correlation Model,DCM)。该模型通过优化改进后的Weighted IC,显著提升了模型性能,年化超额收益较基准提升了7.41个百分点,信息比率提升了0.9。报告强调设计高信噪比的目标函数为提升深度学习策略表现的关键,并给出相关风险提示,如训练随机性风险、因子衰减风险和历史表现不代表未来。
---
二、逐节深度解读
1. 投资聚焦:重设目标函数,破局低信噪比
- 关键论点:
深度学习在偏高频量化中因数据量大、信号多,表现良好;但在偏低频量化中受限于因收益率本身信噪比较低,使得模型训练难度大,表现提升有限且稳定性和解释性较差。
- 逻辑与假设:
传统收益率拟合目标产生的误差信号本身包含大量噪声,导致模型难以利用其容量优势,更复杂模型反而因噪声导致泛化能力下降。传统的缩框正则化方法无法解决信噪比问题。
- 解决思路:
将目标函数从拟合收益率本身切换为优化因子与收益率的相关系数(IC),尤其是带权重的Weighted IC,从统计性质出发提升训练信噪比,更好捕获因子排名与收益的匹配关系。
- 术语解释:
- 信噪比(SNR):指信号强度与噪声强度的比值,信噪比较高有助于模型学习到有效特征;
- 相关系数(IC,Information Coefficient):因子值与未来收益的皮尔逊相关系数,衡量因子预测效果;
- List-wise方法 vs. Point-wise方法
List-wise方法考虑整个样本列表的排序或相关结构,信噪比更高;而Point-wise方法单独看每个样本点,受噪声影响更大。
2. 传统因子合成方法简介
- 包括4种主流方式:
1) 等权法:标准化后直接平均,简单无假设;
2) 历史IC加权:用历史IC均值赋权,体现因子历史表现;
3) 最大化ICIR加权:将因子权重优化成IC均值与标准差的比例,得到解析解$\mathbf{w}^ = \Sigma^{-1} \times IC$;
4) 最大化IC加权:最大化IC本身,权重为当前协方差逆乘IC,$\mathbf{w}^ = V^{-1} \times IC$。
- 意义:后两种为线性优化,具解析解,比前两种启发式方法理论基础更扎实。
3. 模型设计:以优化IC为目标的DCM模型
- 损失函数设计对比:
- 传统Loss1基于均方误差衡量拟合收益的准确度,信噪比低;
- 提议Loss2以负相关系数作为损失函数,更关注当期样本整体排序与收益的相关性,捕获排序信号,信噪比更高。
- 优势:
Loss2更关注多头选股策略中分数的大小排序,正是实际投资决策关注的核心。
- Weighted IC:
引入加权IC以解决整体IC为正但高因子值区域表现差异的“陷阱”,采用序列指数衰减权重,使模型更加关注表现最佳的头部因子样本,有效提升多头选股的实用表现。
- 技术细节:
- 神经网络采用两层32个单元的全连接层+批标准化(Batch Norm)层,输入21个因子;
- 损失计算过程对输出预测分数排序,与权重排序匹配后计算Weighted IC,按时间指数衰减加权求和;
- 因子与收益均行业市值中性化,转换为排序分位数,保证样本间公平比较;
- 图示分析:
图1、图2分别展示两组因子值与收益的排序及散点分布,体现整体正相关的相关系数相同,但局部排序对应的收益结构差异明显,验证了Weighted IC关注头部排序的必要性。[page::4-6]
4. 因子数据及处理流程
- 因子共21个,覆盖偿债能力、盈利能力、盈利波动性、成长能力、经营能力、分析师预期、投资者认可度等8大类关键指标。
- 通过细分行业和市值分组后转化为排序分位数,实现行业和规模中性化,有效剥离系统性风险。分组方式细致,共90个小组,确保分布均衡。
- 该多维度因子体系保证了模型输入的多样性与完整性。[page::6-7]
5. 模型测试与表现
- 基线对比系统包括等权、历史IC加权、最大化IC、最大化IC
- 测试期间2012年1月1日-2021年10月26日,均选取市场非ST股票,调仓频率月度,交易手续费单边3‰。
- DCM策略整体年化超额收益16.50%,信息率2.31,超额最大回撤6.76%。除个别年份2016、2018表现弱外,其他均实现超额收益超过10%。
- 性能提升亮点:
- DCM对比Loss1神经网络,年化超额提升7.41个百分点,信息率提升0.9;
- 线性最大化IC模型到非线性DCM模型的转变,年化超额提升2.98个百分点,信息率提升0.22。
- 图5展示净值走势,DCM策略明显跑赢中证500指数,且超额收益呈现稳健增长趋势。
- 表2具体展示年度收益、波动率、夏普比率、信息率、最大回撤及回撤天数等关键指标,验证了模型稳定性和收益性。
- 图6进一步细化各种模型相对中证500的收益表现,DCM持续领先其他模型。[page::7-9]
6. 策略分析:Weighted IC提升及模型泛化
- 图7、图8分别展示DCM相较于等权和历史IC加权模型在训练集和测试集上的Weighted IC提升,训练集提升显著,测试集表现稳定优于基准。
- 图9、图10通过散点图显示,DCM在基准模型Weighted IC为负时提供明显正向提升,在基准表现较优时则有削弱作用,总体提升模型在低表现期的稳定性。
- 此模式说明DCM增强了策略的抗回撤能力,有助于长期复利效应积累。
- 图11两张相关性散点图进一步印证DCM提升与原模型表现负相关的现象。[page::9-11]
7. 结论与投资建议
- 本文核心创新是设计基于IC的目标函数,解决收益率拟合信噪比低造成的训练困境,提升了模型学习的有效性。
- DCM模型结合Weighted IC目标与浅层深度神经网络结构具体实现,增强了多因子合成的排名相关性。
- 在超过9年历史数据回测中,策略取得了显著超额收益和良好风险控制。
- 建议投资者关注目标函数设计在深度学习量化策略中的重要性,并持续关注因子质量及模型训练稳定性风险。
- 风险因素包括:训练随机性、因子效果衰减及历史业绩不代表未来等常见量化策略风险。[page::11]
---
三、图表深度解读
图1、图2(页4)
- 描述:两组因子值与收益率分位排名的散点图及回归直线展示,相关系数均为0.2364。
- 解读:两组整体相关性相同,但局部(头部因子值股票)收益表现差异巨大,直观显示只靠整体IC无法确保头部表现,从而影响多头选股效果。
- 联系文本:说明了设计Weighted IC目标函数的必要性,以提高对头部表现的关注,避免整体统计正相关却局部为负的现象。
图3(页5)
- 描述:神经网络结构图,输入21个因子,经过两层32单元全连接层和批标准化,最后输出映射结果。
- 解读:网络设计简洁,深度有限,便于训练且降低过拟合风险;批标准化提升训练稳定性与收敛速度。
图4(页6)
- 描述:单期损失函数计算流程图,展示样本因子通过网络映射得分,排序后计算Weighted IC,结合权重计入总损失。
- 解读:清晰体现了目标函数设计从单个样本映射到全局截面统计的递进过程,注重同一期排序整体相关性。
图5(页8)
- 描述:策略净值与中证500对比,展示2012-2021年期间DCM策略表现。
- 解读:DCM策略净值稳健上升且显著跑赢基准市场指数,反映超额收益的实现。
图6(页9)
- 描述:六个模型相对中证500的相对收益走势对比。
- 解读:DCM模型曲线持续高于其他基线,突出其综合优化成效,Loss1神经网络也优于传统加权方法。
图7、图8(页10)
- 描述:DCM相较于等权与历史IC加权模型的Weighted IC提升,分别在训练集和测试集上展示。
- 解读:均显示DCM在不同时间段带来约2%-3%的相关性提升,验证模型具有稳定泛化能力。
图9、图10(页10)
- 描述:散点图形象显示基准模型Weighted IC与DCM提升的关系。
- 解读:两者呈负相关关系,即基准模型表现差时DCM提升显著;基准模型表现极好时DCM提升反而会减少,提升整体稳定性。
图11(页11)
- 描述:两图进一步支持上述负相关提升特征。
- 解读:强调DCM模型弥补基准模型弱点区域,提高整体策略的抗风险能力。
---
四、估值分析
报告核心在量化策略模型构建与测试,未涉及直接企业估值方法,因此无估值模型部分。主要贡献为量化选股因子优化与深度学习结合的创新实践。
---
五、风险因素评估
- 训练随机性风险:神经网络训练涉及随机初始化和数据随机抽样,模型结果存在波动性。
- 因子效果衰减风险:因子在未来市场表现可能弱化,导致模型效果下降。
- 历史业绩不可代表未来表现:所有回测均基于历史数据,未来市场环境变化不可预测,需警惕模型失效风险。
- 缓解策略:报告中未明确给出具体缓解措施,但通过设计目标函数增加信噪比,提升模型泛化性,部分缓解风险。
---
六、批判性视角与细微差别
- 优势明显:报告创新点在于改进目标函数设计,从根本角度解决深度学习在低频量化中的信噪比瓶颈,且测试数据支持提升观点。
- 潜在局限:
- 网络结构较简单(仅两层全连接)可能限制模型捕获复杂非线性关系的能力;
- 报告未详细披露超参数选取、训练稳定性细节及模型在极端市场条件下表现,不利于全面评估鲁棒性;
- Weighted IC权重设计基于经验,缺少更系统的权重选择理论与残差分析;
- 目标函数转换虽提升了信噪比,但训练目标与实际收益最大化仍有差距,潜藏模型与实际投资逻辑的不完全一致风险;
- 未讨论因子样本外适应性(新因子、结构调整)或因子滞后问题。
- 内部细节:
- 基准模型最大化IC_IR表现较差,可能因对方差惩罚过重导致过拟合防控过度,相关性较低;
- 结果表明线性方法与非线性方法结合优势显著,但线性模型仍为合理基线。
---
七、结论性综合
本报告由中信证券量化研究团队发布,系统地论述了如何通过“重设目标函数”从本质上提升深度学习多因子策略在低频投资领域的表现。报告提出并实现了以因子与收益相关系数(尤其是加权的Weighted IC)作为目标函数,促进模型训练时对全样本排序的整体相关性的学习,从而显著提升信噪比,突破直接拟合收益产生的噪声干扰瓶颈。
采用两层32单元全连接神经网络配置,结合批标准化和指数衰减权重设计,DCM模型在历史区间测试中实现了16.50%的年化超额收益和信息率2.31,明显优于基线模型,且提升效果稳定且具有不错的抗回撤能力。图表(如图5至图11)直观展示了该模型在净值增长、相对收益及相关性指标上的优势,尤其在基准模型表现不佳时期,DCM提供显著正向提升,强化了模型的稳健性和长期投资价值。
整体来看,报告逻辑严密,数据充分,设计理念契合理,具备一定的理论及应用价值。其核心贡献在于通过优化训练目标,使得深度学习量化策略能够在传统困难的低频环境下获得突破,为多因子策略领域的发展提供了可行路径。
建议投资者和研究员关注深度学习策略目标函数设计,兼顾模型复杂度和信噪比的平衡,并持续跟踪因子衰减与市场结构变化对模型适应性的影响。同时,对模型的训练稳定性和风险管理保持审慎态度,结合实际投资需求进行策略调整。
---
参考溯源
- 低信噪比及深度相关模型提出、目标函数设计全过程详见页0-6。[page::0-6]
- 因子数据、样本行业市值中性处理及神经网络结构页6-7。[page::6-7]
- 测试基线系统与策略表现页7-9;核心绩效对比、信息率及回撤分析页8-11。[page::7-11]
- 图表深度解读主要位于第4-11页,涵盖因子与收益序列图、网络结构图、损失流程图及历史表现相关图。[page::4-11]
- 风险因素及结论页11。[page::11]
---
整体评价:该份研究报告专业严谨,系统提升了深度学习模型在低频因子量化选股中的应用表现,对金融工程与量化投资服务有重要借鉴意义。