深度学习揭秘系列之一:基于量价与基本面结合的深度学习选股策略
创建于 更新于
摘要
本报告基于深度学习尤其全连接神经网络模型(MLP),结合量价因子Alpha158及基本面因子,开展股票收益率预测研究。结果表明,MLP在量价因子上的非线性组合显著优于线性Lasso模型,5日RankIC提升1.82pct,多头超额收益提升9.42pct,且分支网络端到端结合量价与基本面因子后进一步提升预测效果。基于混频策略结合短期5日和长期20日收益预测,构建主动量化组合,取得显著超额收益与较好风险调整表现。中证1000指增策略显示年化超额收益13.17%,信息比率3.56,验证了模型在指数增强中的有效性。风险提示模型可能因市场环境变化失效 [page::1][page::22][page::37][page::41][page::43]
速读内容
深度学习技术基础详解 [page::4][page::9]
- 介绍了神经元结构、激活函数(Sigmoid、Tanh、ReLU)、前馈神经网络(MLP)的基本原理和反向传播算法。
- 采用Adam优化算法与Dropout正则化提升模型训练鲁棒性与泛化能力。




量价与基本面因子数据集及预处理 [page::10][page::12][page::13]
- 量价因子采用开源Alpha158,共158个涵盖日内、波动、价、量、量价相关因子,基本面因子涵盖估值、质量、成长与分析师预期共38个。
- 特征经去极值、截面标准化处理,标签为未来5日与20日的VWAP收益率截面排序。
- 训练采用滚动时间窗口方式,使用Lasso与两层MLP网络比较模型表现。
MLP相较于Lasso在线性模型上的显著提升 [page::16][page::17][page::18][page::19]


- MLP模型对量价因子在5日预测中,RankIC提升1.82%,多头超额收益年化提升9.42%,多空超额提升40%。
- 基本面因子对比LP效果提升有限,因逻辑偏线性且数据结构限制。
- MLP对于20日预测效果同样优于Lasso,表明非线性模型优于线性模型。
MLP模型隐藏层参数敏感性分析 [page::20][page::21]
- 不同神经元数量、层数的全连接网络均实现了比Lasso更优表现,参数设置对成果稳定性影响有限。
- 神经元数量增大能提升RankIC,但过大可能过拟合,推荐第一层多第二层少的结构设计。
表格示例:
| 隐藏层神经元数量 | RankIC | ICIR |
|------------------|---------|--------|
| 128 | 12.39% | 1.37 |
| 256 | 12.39% | 1.42 |
因子合成多种方式比较 [page::26][page::27][page::29][page::30][page::31][page::32][page::33][page::34]
- 线性等权结合和ICIR加权均未显著超越纯量价因子。
- 输入层拼接与分支网络两种非线性合成显著提升因子表现,分支网络提升效果最大,5日调仓多头超额收益达24.99%,多空超额132.21%,更优的风险控制指标。


高频量价与Alpha158低频量价及基本面因子结合强化效果 [page::35][page::36]
- 将信达金工29个高频量价因子加入分支网络,最终5日调仓组合多头超额收益提升至25.29%,换手率32.37倍,20日组合收益17.62%。

长短期收益预测混频组合策略效果突出 [page::37][page::38][page::39]
- 短期5日与长期20日量价、基本面因子结合,通过混频组合实现收益增强。
- 多头超额收益提升6.98%-3.26%,换手率介于5日与20日因子组合之间,最大回撤接近底仓20日组合,风险控制良好。

中证1000指数增强策略表现良好 [page::40][page::41]
- 基于20日合成因子构建中证1000指数增强组合,年化收益11.59%,超额收益13.17%,信息比3.56,换手率7.61,表现稳定。

风险提示 [page::43]
- 本研究基于历史数据,模型可能因市场环境变化失效,存在预测风险。
深度阅读
金工研究报告《深度学习揭秘系列之一基于量价与基本面结合的深度学习选股策略》详尽分析
---
1. 元数据与报告概览
报告标题:深度学习揭秘系列之一基于量价与基本面结合的深度学习选股策略
作者及联系方式:
- 于明(金融工程与金融产品首席分析师,执业编号:S1500521070001)
- 周金铭(金融工程与金融产品分析师,执业编号:S1500523050003)
- 孙石(金融工程与金融产品分析师,执业编号:S1500523080010)
机构:信达证券股份有限公司
发布日期:2024年8月6日
研究主题:结合量价因子与基本面因子,应用深度学习尤其是多层感知机(MLP)构建选股策略,探讨非线性模型对因子有效性和组合收益的提升作用。
核心论点:
- 非线性模型(专指MLP)在量价因子选股上显著优于传统线性模型(Lasso),但在基本面因子上的优势不明显。
- 端到端的分支神经网络结构,通过同时合成量价和基本面子因子,效果优于线性加权及直接拼接输入层的非线性方法。
- 利用长短期混合频率因子组合进一步提升组合收益。
- 在中证1000成分股内,基于低频量价、高频量价及基本面因子的策略表现稳健,超额收益显著。
风险提示主要聚焦于模型历史拟合环境的局限和历史数据有效性受市场环境变化风险影响。
---
2. 逐节深度解读
2.1 深度学习理论基础(章节1)
- 神经元结构与激活函数
报告详细介绍了单个神经元的计算结构,即净输入加权求和后,经过非线性激活函数(Sigmoid族如Logistic、Tanh,以及ReLU)。特别指出ReLU相较Sigmoid在缓解梯度消失和计算效率上的优势(图1、图2均形象展示激活函数形状)[page::4-5]。
- 前馈神经网络(MLP)结构及通用近似定理
强调MLP通过层叠非线性函数复合映射强大的拟合能力。通用近似定理说明了具有适当激活函数与隐藏单元的MLP具备任意精度逼近函数的能力,奠定深度学习选股的理论基础[page::6-7]。
- 反向传播算法与参数优化
系统梳理梯度计算与链式法则的应用,通过反向传播更新全网络权重参数。介绍Adam优化器,结合动量法和RMSprop机制,自适应调整学习率以加速并稳健收敛。同时引入Dropout层用于防止过拟合,通过训练时随机丢弃部分神经元增强模型泛化能力[page::7-9]。
2.2 因子数据集与预处理(章节2.1-2.3)
- 量价因子(Alpha158)
因子含158个量价指标,裂分为5类(日内、波动、价、量、量价相关性),涵盖价格及成交量多时间窗口统计特征。详细因子释义和公式覆盖日内波动如K线长度,高低价位置比率,价格移动平均、回归残差、成交量波动等[page::10-12]。
- 基本面因子
包含38个因子,涵盖估值(EP、BP等)、成长(净利润同比及标准化偏差)、质量(ROE等)、分析师一致预期维度。该集因子主要基于财报和预告数据,更新频率低于量价因子[page::12-13]。
- 数据处理与标签
对因子去极值、截面ZSCORE标准化、市值行业中性化。标签为股票未来5日及20日的VWAP收益率的截面排序百分比。数据样本时间2013年底开始,用滚动方式训练和验证。回测覆盖2013.12.31至2024.5.31。组合取最优因子10%股票为多头,等权持有,交易费千分之一,剔除新股和ST股[page::14-15]。
- 路径依赖问题
针对多周期调仓间因不同起点产生的路径依赖,采取多起点测试路径合并归一化处理,计算各条净值曲线收益均值得到公平综合表现[page::15]。
2.3 Lasso与MLP模型表现对比(章节2.4-2.5)
- 量价因子表现(表3-4、图7-8)
MLP模型在预测未来5日与20日收益的RankIC均超出Lasso 1.82%-1.94%,多头超额收益分别提升9.42%和6.54%,多空超额更是有显著提升(40%级别)。但Lasso在最大回撤等风险指标上表现稍优[page::16-17]。
- 基本面因子表现(表5-6、图10-11)
MLP基本面因子相比Lasso仅有微弱提升(5日RankIC提升约0.35%,20日几乎无异)。同时多头和多空收益风控指标相近。作者总结可能的原因包括基本面因子本身线性关系强,财报期非信息及时更新,因子数量有限等[page::18-19, 22]。
- 隐藏层参数敏感性分析(表7-10)
不同隐藏层神经元数目对模型RankIC和ICIR的影响有限。总体来看,隐藏层宽度增加RankIC先升后降,参数设置的灵活性较大。两层结构中,第一层设置大、第二层适中构成最佳策略[page::20-21]。
- 综合小结
非线性MLP显著提升量价因子选股能力,但对于基本面因子提升有限。主要原因系量价因子复杂非线性关系更强,而基本面因子偏线性,数据更新频率较低,因子数量少[page::22]。
2.4 衡量MLP多头超额收益(章节2.7-2.8)
- 5日调仓量价因子多头超额收益达22.45%,基本面因子10.85%,单边年化换手率差异明显(量价34.23倍,基本面12.62倍)。20日调仓对应分别为16.62%和9.21%,换手率分别为9.28倍和5.84倍。多头超额收益与风险指标详见表11-14,图12-15[page::23-24]。
2.5 多因子结合策略(章节3)
- 1)线性等权结合统一神经网络输出量价因子与基本面因子,结果IC和超额收益均低于纯量价因子,原因在于基本面因子有效性确实较低[page::26-27]。
- 2)ICIR加权线性加权,随时间动态调整权重,体现了2016年后量价因子ICIR下降,基本面因子ICIR稳定且近期提升趋势。最终ICIR加权因子表现仅略优于纯量价因子,且多空超额不稳[page::27-28]。
- 3)非线性输入层拼接:将量价和基本面因子进行拼接,结合到神经网络训练,能捕获交叉信息,效果较线性加权进一步提高,RankIC提升0.23pct,多头超额提升1.75pct,风险指标改善[page::29-30]。
- 4)分支网络端到端学习:分别预训练量价因子和基本面因子对应子网络,再拼接隐藏层输出并线性加权合成。该结构允许模型自动学习因子间的子合成与加权关系,性能显著优于其他结合方法,多头超额24.99%,提升2.54pct,年化多空超额收益132.21%,提升9.77pct[page::31-33]。
- 5)20日调仓情形下,分支网络同样有优异表现,综合指标整体领先其他方法,验证其跨期限组合的潜力[page::34]。
2.6 高频因子引入(章节3.6)
- 在基础Alpha158及基本面因子的基础上,加入29个信达金工高频量价因子(自2018年起),构造输入层拼接与分支网络。
- 结果显示高频因子加入后,5日因子RankIC提高到13.04%,ICIR达到1.56;20日因子RankIC为15.42%,ICIR为1.94,超额收益显著提升[page::35-36]。
2.7 混频组合策略(章节4)
- 设计了基于长短期收益预测的混频组合策略:
- 以20日因子为底仓,提取排名前10%股票。
- 以5日因子为高频调整,提取前25%、50%、75%的股票。
- 取交集形成混频增强组合。
- 混频组合超额收益明显优于单一20日组合,收益提升6.98pct至3.26pct不等[page::37]。
- 超额收益非因持股数量缩减导致,排除了集中风险。换手率介于5日与20日组合之间,最大回撤亦处于二者区间,风险收益表现平衡[page::38-39]。
2.8 中证1000指增组合实证(章节5)
- 在中证1000指数成分股范围内,基于20日分支合成因子构建组合,设定个股权重及行业风格偏离限制,每20日调仓。
- 20日因子在中证1000上的RankIC达到15.05%(ICIR1.63),组合年化收益11.59%,信息比3.56,年化换手7.61。相较中证1000整体,实现13.17%的年化超额收益,风险调整指标良好(收益波动比3.77,收益回撤比5.06)[page::40-41]。
---
3. 图表深度解读
- 图1-4(深度学习基础) 形象展示神经元结构、激活函数曲线(Logistic、Tanh、ReLU)、多层神经网络结构及Dropout机制,帮助理解模型非线性构造和正则化方法[page::4-9]。
- 图5(路径依赖处理示意) 展示多起点调仓策略,净值曲线归一化合并以求均值,减少路径依赖偏误[page::15]。
- 图6(MLP模型结构示意) 展示针对量价因子的2层全连接网络架构及参数维度,从5000股票样本输入到最后1维回归输出[page::16]。
- 图7-8(量价因子RankIC曲线) MLP模型曲线持续领先Lasso,说明MLP在5日和20日预测收益率优于线性模型[page::17]。
- 图9-11(基本面因子RankIC) MLP与Lasso曲线相近,时间跨度长,未显著提升。整体预示基本面经非线性映射挖掘潜力较低[page::18-19]。
- 图12-15(多头多空超额收益) 展示MLP量价因子和基本面因子构建的多头组合净值和对比基准,验证5日和20日调仓算法的有效性及持仓更新对收益的影响[page::23-24]。
- 图16-18(线性因子组合) 展示等权结合因子效果不如纯量价因子,ICIR加权稍有提升,但与非线性结合仍有差距[page::26-27]。
- 图19-20(ICIR动态权重) 量价因子ICIR自2016年后下降,基本面稳定,2023年起基本面效果提升超过量价因子,映射权重变化趋势[page::27]。
- 图21-23(ICIR加权因子表现) 显示ICIR加权因子RankIC与纯量价因子接近,但整体多头和多空超额收益没有实质领先,反映线性加权限制[page::27-28]。
- 图24-27(输入层拼接网络结构与效果) 输入层拼接可捕获更复杂特征交互,提升IC、超额收益且风险降低,显示非线性融合优势[page::29-30]。
- 图28-31(分支网络结构及表现) 分支网络端到端训练,合成因子在IC、超额收益和风险指标均优于前述所有方案,表明该方法对不同因子子集特性区别处理的有效[page::31-33]。
- 图32-37(各种合成方法对比) 无论5日或20日调仓,分支网络合成因子均为领先者,进一步巩固该方法优势[page::33-34]。
- 图38(高频因子引入分支网络结构图) 形象展示高频因子与低频量价及基本面因子融合到统一模型架构,支持后续性能提升[page::35]。
- 图39-40(最终组合多头净值曲线) 纳入高频量价因子后,组合收益率及超额明显提升,表现更稳健[page::36]。
- 图41-44(混频组合表现) 混频组合较原始20日组合显著超额收益,提升最明显为交集5日因子前25%股票组合,证明短期调仓选股能力提升带来的价值[page::37-39]。
- 图45-46(中证1000组合表现) 指增组合相较中证1000指数实现稳定超额收益,风险调整表现可观,信息比一度高达3.56,展示因子应用的实盘可行性[page::40-41]。
---
4. 估值分析
本报告聚焦因子模型与组合构建,未涉及单个股票估值分析,采用的评估指标主要为RankIC(因子相关性衡量)、ICIR(IC的稳定性指标)、年化超额收益及收益风险比率等组合绩效指标,并辅以换手率和最大回撤等风控指标,对因子有效性与模型优劣做定量评价。
---
5. 风险因素评估
- 主要风险为模型结果基于历史数据有效性假设,市场环境变化时,模型可能失效。
- 报告未系统提供缓解策略,但通过模型分层拟合、正则化、Dropout、动态因子加权,已在一定程度上强化模型稳健性。
- 换手提升易增加交易成本及滑点,混频策略换手较高,执行风险需关注。
- 财报基本面因子滞后、更新不及时导致短期预测能力有限,可能限制因子融合效果。
- 选股因子覆盖面限制(Alpha158及有限基本面因子),存在样本外适用风险。
---
6. 批判性视角与细微差别
- 虽然非线性模型在量价因子上的优势明显,但对基本面因子无显著提升可能反映海量非线性特征并非均有经济意义,部分可能是技术噪声,故非线性建模需谨慎。
- 基本面因子在报表间隔期不变,可能使得非线性模型退化为线性或受损,报告虽指出但未充分探索强化动态基本面因子的方法。
- 报告核心的数据样本库及因子编制方式局限,后续研究可加入更多宏观、情绪等另类数据维度提升模型。
- 多频调仓和混频组合提高收益与换手率并存,需要进一步贴近交易成本、市场冲击进行模拟,现有结果未体现实盘全部成本因素。
- 组合风险指标如最大回撤幅度仍较大,尤其多空组合,投资者在实际应用中仍需结合自身风险承受能力。
- 报告未提及多模型集成或最新深度学习技术(如Transformer、图神经网络)可能的增益点,存在拓展空间。
---
7. 结论性综合
该深度学习选股策略系列报告的第一篇,系统阐述并实证了基于量价因子和基本面因子的非线性融合选股策略的研究过程与成果。核心结论如下:
- 通过清晰的神经网络基础理论阐述(包括神经元结构、激活函数、逆向传播、Adam优化器及Dropout等),为后续实证研究提供扎实理论支持[page::4-9]。
- 利用开源Alpha158量价因子和丰富的38个基本面因子,构建线性(Lasso)和非线性(MLP)组合模型,验证非线性模型对量价因子的预测能力显著优于线性模型(提升RankIC约1.8%-1.9%、多头超额收益超9%),但对基本面因子提升有限,理由包括基本面的线性特征较强及因子新鲜度较低[page::10-23]。
- 预测结果结合风险指标显示,非线性模型总体收益更优,但Lasso对风险控制更稳定。隐藏层结构包含两层,全连接神经网络的性能对神经元数量敏感度有限,参数调整空间较大[page::20-22]。
- 多因子融合方面,线性等权结合和ICIR加权难以超越纯量价因子的表现;而神经网络的输入层拼接及分支网络端到端训练实现了更优异的融合效果,分支网络合成因子RankIC提升至12.9%,多头超额年化收益达到24.99%,多空超额收益132.21%,均优于其他方法[page::25-33]。
- 加入高频量价因子后组合表现进一步提升,结合高频、低频量价与基本面因子的分支网络主导了最终选股效果,5日调仓组合年化超额收益25.29%,20日组合达17.62%,信息比显著提高[page::34-36]。
- 设计了以20日因子为底仓、5日因子做高频调整的混频组合,有效提升超额收益6.98%-3.26%,换手率与风险控制介于单一因子组合之间,彰显短期收益信息和长期趋势结合的策略优势[page::37-39]。
- 将此深度学习选股模型应用于中证1000域构建指增策略,实现了11.59%的年化收益和13.17%相对超额收益,风险调整指标稳健,显示模型具备实际投资组合应用的潜力与空间[page::40-41]。
- 报告对数据更新不及时、换手带来的成本风险及历史依赖性提出风险提示,提醒用户对模型适用性审慎把握[page::43]。
综上,报告客观呈现了基于深度学习的量价和基本面多因子融合研究过程及显著成效,特别是分支网络端到端学习架构的创新性贡献,为股票量价基本面融合的深度学习选股方法提供了科学、系统且实证有效的解决方案,具备较强的理论价值和实际应用潜力。
---
参考引用
- 上述所有核心结论均有详细页码对应,数据、图表、模型结构等信息均在报告中给出明确出处,确保分析和结论的严谨与可追溯[page::4-41, 43]。
---