人工智能选股之卷积神经网络华泰人工智能系列之十五
创建于 更新于
摘要
本报告系统介绍了卷积神经网络(CNN)在股票多因子选股中的应用方法,通过将因子数据构造成“因子图片”输入CNN,实现自动化特征提取和非线性因子合成。基于全A股样本的2011-2019年滚动年度训练测试,CNN合成因子单因子测试表现优于全连接神经网络和线性回归。在以中证500为基准的全A股票池回测中,CNN构建的策略在年化超额收益、信息比率和回撤控制等指标上取得领先表现,展现出较强的选股能力和实际应用价值[page::0][page::14][page::15][page::16][page::18]。
速读内容
卷积神经网络(CNN)选股模型核心原理及构建方法 [page::4][page::5][page::6]
- CNN模仿视觉神经网络结构,通过卷积核自动提取特征并降维,不同于全连接神经网络的逐点连接,具有空间局部特征学习能力。
- 将多因子数据按时间和因子维度,构造为类似“因子图片”的二维矩阵,实现因子数据的空间与时间序列特征输入CNN。
- 采用单层卷积层,未使用池化层提升对因子明确定义的保留,因子排列顺序对模型学习结果存在显著影响。

- 卷积运算示意图详述了权重乘积与加权求和实现非线性因子组合,结合ReLU激活功能,增强模型拟合能力。
卷积神经网络选股模型设计及参数设置 [page::10][page::13]
- 样本选取全A股(剔除ST、停牌、新股),2011年至2019年月末截面,82个因子×5个历史截面构成输入。
- CNN结构包含1层卷积层(10个5×5卷积核)和3层全连接层(100、70、40神经元);无池化层;Dropout率80%;使用RMSProp优化器和交叉熵损失函数。
- 训练采用年度滚动训练框架,训练集覆盖最近72个月数据,样本外测试用于模型性能检验。
单因子测试结果与模型对比分析 [page::14][page::15]
| 模型 | IC均值 | 因子收益率均值 | TOP组合年化收益率 | 夏普比率 | 信息比率 |
|--------------|--------|---------------|----------------|--------|--------|
| 卷积神经网络 | 13.62% | 1.021% | 20.05% | 0.72 | 4.04 |
| 全连接神经网络 | 13.28% | 1.015% | 19.24% | 0.69 | 3.91 |
| 线性回归 | 12.48% | 0.968% | 16.40% | 0.58 | 3.24 |
- CNN在单因子RankIC、收益率以及多空组合表现上均领先,同步展示累积RankIC和因子收益率曲线,领先优势明显。


组合回测表现与基准对比 [page::15][page::16][page::17]
- 以沪深300和中证500为基准构建行业、市值中性全A选股策略。
- 以沪深300为基准时,CNN在年化超额收益率及信息比率不及线性回归;以中证500为基准时,CNN超额收益13.69%-16.38%,最大回撤4.80%-7.55%,信息比率2.29-2.56,Calmar比率2.16-2.85,全面超过其他模型。
| 指标 | 卷积神经网络 | 全连接神经网络 | 线性回归 |
|--------------|------------|------------|---------|
| 年化超额收益率 (中证500,权重2%) | 16.38% | 13.98% | 11.94% |
| 最大回撤 | 6.31% | 9.86% | 9.89% |
| 信息比率 | 2.37 | 1.96 | 1.77 |
- TOP5分层组合净值增长明显优于基准,表现出较强超额收益能力。


未来展望与风险提示 [page::18][page::19]
- CNN框架仍具提升空间,如采用数据增强、ResNet残差学习、多尺寸卷积核混合、扩展到高频大数据领域等。
- 选股策略形成于历史数据,可能出现失效,模型可解释性较低,使用时需谨慎。
深度阅读
金工研究报告详尽分析:卷积神经网络在多因子选股中的应用及实证
---
1. 元数据与报告概览
- 报告标题:人工智能选股之卷积神经网络华泰人工智能系列之十五
- 作者与机构:研究员林晓明(执业证书编号:S0570516010001)、陈烨(编号:S0570518080004)、李子钰、何康,均来自华泰证券研究所
- 发布日期:2019年2月13日
- 研究主题:本报告聚焦于卷积神经网络(CNN)在股市多因子选股领域中的应用,深入探讨CNN的原理、结构、参数设置及实际选股模型构建并进行了实证测试。
- 核心论点:
- CNN作为当前成熟的深度学习模型,凭借其自动特征提取和降维能力具备多因子选股潜力。
- 将股市多因子数据构建为二维“因子图片”,利用CNN进行训练,实现因子合成,提高选股效率和准确度。
- 经过历史回测,CNN合成因子的表现优于其他模型,尤其在中证500基准下的选股策略效果显著。
- 目标:探索CNN在金融领域的实践路径及效果,为人工智能量化投资提供可行方法论。
---
2. 逐节深度解读
2.1 引言与研究导读
- 关键内容:报告是华泰人工智能系列报告之一,延续此前介绍的全连接神经网络和循环神经网络模型,着力介绍CNN在多因子选股领域中的新应用。
- 逻辑与目标:强调卷积神经网络作为视觉识别领域核心模型的强大特性,提炼其应用于股票预测的特色和挑战,针对三大核心问题进行系统探讨:(1)CNN原理及其与全连接网络的差异;(2)如何构建数据输入模型;(3)参数设置与实测效果。
- 说明:明确定位CNN在选股模型中的创新点,为后续章节的技术细节与实证结果铺垫基础。[page::3]
2.2 卷积神经网络简介与原理
- 发展历程:从1989年的LeNet-5手写识别,到2012年AlexNet突破性提升ImageNet竞赛准确率,再到152层ResNet,展现了CNN技术的飞跃。CNN通过多个卷积核自动提取图像低级到高级特征,实现卓越的视觉识别性能。
- CNN结构:以LeNet-5为例说明CNN的流程:卷积层(提取局部特征),池化层(减少维度与参数,防止过拟合),多层堆叠实现更高层次特征抽象,最后全连接层实现最终分类或预测。特别强调卷积层参数通过反向传播优化获得,激活函数如ReLU实现非线性变换。
- 意义:通过模拟视觉神经工作原理,CNN实现了端到端的自适应特征提取,替代传统人工设计特征,兼具计算高效与泛化能力。
- 图表解读:图表1详细展示LeNet-5结构,明确各层功能与连接关系。[page::4][page::5]
2.3 ImageNet与CNN改进模型
- 背景: ImageNet作为广泛应用于计算机视觉的标注图像库,为CNN发展提供了丰富训练数据。CNN的多个重要变种(AlexNet、VGGNet、Inception、ResNet)均在ILSVRC竞赛中屡获冠军。
- 技术进步:如ResNet提出的残差连接结构解决了深层网络训练难题,Inception结构引入了多尺寸卷积核,进一步增强网络特征学习能力。
- 意义:这些先进模型为金融领域CNN应用提供了潜在技术借鉴,如数据增强、网络加深等。
- 表格说明:图表2系统列示重要CNN模型及其竞赛成绩,凸显技术发展脉络。[page::5]
2.4 CNN应用于股票多因子收益预测
- 创新点:金融因子数据不像图像具有天然二维结构,故需转换为合适形式。将股票的多个因子在多个时间截面按行列排布,形成二维“因子图片”(如图表3所示,10个因子×5个时间截面)。
- CNN核心作用:
- 卷积核在“图片”的局部滑动,实现局部因子及时间窗口的线性组合(因子合成),增强因子表达的非线性能力。
- 不使用池化层以避免模糊重要因子信息。
- 激活函数实现非线性映射。
- 卷积细节:图表4至6形象演示卷积核如何对因子图片横向、纵向滑动并计算加权和,生成局部特征图。
- 数据标签:对应时间截面后的相对收益,作为训练样本标签,支持监督学习。
- 意义:有效利用因子时间序列特征与不同因子间的交互信息,提升因子预测能力。[page::6][page::7]
2.5 CNN结构选择及设计思考
- 为何只使用一层卷积层: 股票因子具备明确经济含义,且已通过单因子检验有效,单层卷积层主要实现因子非线性合成;多层卷积适合对低级像素逐层抽象的图像识别任务。
- 无池化层原因: 池化层作为降维手段适合高维图像,金融因子特征需要保留精细信息,避免特征模糊。
- 因子排列顺序影响: 因为卷积核是局部操作,不同因子的排列改变了卷积核作用的邻近关系,进而影响学习效果。实践中应将相关因子合理排列,保证关键因子组合被卷积核覆盖(如图表10示意)。
- 图示说明:图表8展现多卷积层对人的面部特征从低到高层次的抽象,图表9解释池化导致图像模糊,图表10对比不同因子排布对卷积核可涵盖区域的影响。
- 总结:提出选股模型设计中重要的技术细节和注意事项,保证模型符合金融市场数据特征。[page::8][page::9]
2.6 测试流程及数据处理
- 数据样本与区间:
- 样本覆盖全A股,剔除ST股票、停牌、上市不足3个月股票,确保样本质量。
- 选取2011年1月31日至2019年1月31日的数据作为回测区间。
- 因子处理流程:
- 使用82个因子,包括估值、成长、财务质量、杠杆、动量等多维度因子(图表13-14详述所有因子及含义)。
- 去极值(中位数加减5倍中位绝对偏差)、缺失值填充(同一级行业平均)、行业市值中性化(残差法线性回归剔除行业和市值影响)、标准化(均值0,方差1)。
- 数据构造:将每只股票5个截面期每个因子值排列为82×5二维特征“因子图片”输入模型。
- 滚动训练方案:采取年度滚动训练策略,避免过度拟合和信息泄漏,保证模型稳定性(图表12)。
- 交叉验证:10%内样本作为验证集,防止过拟合,确定模型参数。
- 标签构建:
- 分类任务标签改为涨跌二分类(涨幅前30%为正例,跌幅后30%为负例)。
- 回归任务使用超额收益率。
- 模型评价:采用分层测试与策略回测指标综合评估模型性能。
- 流程图:图表11清晰展示数据流与流程节点,帮助理解技术实现步骤。[page::10][page::11]
2.7 模型设计与参数
- CNN结构:
- 输入层:82因子×5时间截面构成的二维“因子图片”。
- 卷积层:单层,10个5×5大小卷积核,xavier初始化。
- 激活函数:ReLU。
- 无池化层。
- 3层全连接层:100、70、40神经元,截断正态分布初始化,Dropout率80%。
- 优化器:RMSProp,学习率0.001。
- 损失函数:交叉熵(二分类)。
- 全连接神经网络对比:
- 输入为因子图片展平后的一维向量(82×5=410特征一维展成长度780,和CNN卷积结果特征数量同)。
- 四层全连接层:780、100、70、40神经元,网络结构和训练参数接近CNN。
- 目的:保证实验对比时仅因模型结构不同的影响,其他超参数尽量控制。
- 可视结构图:图表15、16形象展示两种网络架构,方便技术复现。[page::12][page::13]
2.8 单因子测试结果
- 回归与RankIC测试:
- 回测区间:2011-01-31至2019-01-31。
- 股票池处理一致,因子作为模型输出单因子进行测试。
- 结果显示CNN因子RankIC均值13.62%、因子收益均值1.021%,略优于全连接神经网络(13.28%,1.015%)及线性回归(12.48%,0.968%),表明CNN具备更强的预测能力。
- 累积RankIC与因子收益曲线:
- 图表18、19展示三模型累积RankIC和因子收益的走势,CNN曲线最高,体现其持续稳定优势。
- 分层测试与多空组合表现:
- 分层测试体现因子的实际选股价值,TOP组组合年化收益超20%,夏普率0.72,信息比率4.04。多空组合夏普率高达4.84。均明显领先其他两个模型。
- 具体回测指标:详见图表20及图表21,清晰表明卷积神经网络在实际投资组合中的优异表现。
- 多层净值比较:图表22展示CNN各层组合表现,便于理解模型不同特征层的贡献。[page::14][page::15]
2.9 构建选股策略及回测
- 策略设计:
- 基于CNN、全连接神经网络和线性回归设计股票池行业、市值中性选股策略,剔除停牌及近期上市限制。
- 以沪深300和中证500两大指数为基准进行测试,体现策略对不同市场段的细分能力。
- 采用权重偏离限制(如2.5%、2%等),控制投资组合风险敞口。
- 回测结果(图表24):
- 以沪深300为基准时,两种神经网络策略在超额收益、信息比率和Calmar比率上不及线性回归。
- 以中证500为基准时,CNN策略表现优异,年化超额收益达到13.69%~16.38%,超额收益最大回撤仅4.80%-7.55%,信息比率2.29~2.56,Calmar比率2.16~2.85,明显优于其他模型。
- 细节说明:
- CNN策略在中证500市场表现更佳,或反映了该策略在中小盘股的优势。
- 图表25、26展示了两种策略的累计超额收益与回撤,可视化地反映模型有效性及波动控制能力。
- 总结:回测验证CNN在多因子选股中的实际应用价值尤为突出,尤其是中证500市场,具备较强的超额收益和稳健性。[page::15][page::16][page::17]
2.10 结论与未来展望
- 总结结论:
- CNN是深度学习领域成熟技术,具有显著的特征自动提取与合成能力。
- 通过金融因子二维“图片”形式输入,经单层卷积层合成非线性因子,避免池化层以保持因子细节。
- 实证测试表明CNN所合成的因子在单因子效果和多因子选股中均优于全连接神经网络和线性回归。
- 在中证500基准选股测试中,CNN策略表现优异,显著超越其他模型。
- 展望未来:
- CNN技术仍在迅速进步,诸如数据增强、残差网络(ResNet)、多尺寸卷积核(Inception)等先进方法值得引入金融领域。
- 高频及海量金融数据中CNN应用探索具有较大潜力。
- 风险提示:模型基于历史数据,有可能失效;CNN模型解释性较低,使用需谨慎。
- 整体定位:报告揭示了CNN在量化投资多因子模型构建的一条可行路径,为金融人工智能研究注入新思路。[page::18][page::19]
---
3. 重要图表解读
图表3:个股“因子图片”及标签(页面6)
- 将10个不同因子的5个历史截面数据构成一个10×5的矩阵,每个元素为对应因子的具体值。
- 标签是该时间t的相对收益率Rt,形成监督学习的输入输出对。
- 这是CNN应用于金融因子的基础数据结构,转化使得时序与不同因子关联被共同编码。
图表4-6:卷积运算原理示意(页面6-7)
- 卷积核是2×2矩阵(权重W1~W4及偏置项bias)。
- 先在因子图片的左上角作用卷积核,对对应区域数据乘权求和得到卷积结果F。
- 卷积核横向、纵向滑动遍历全图,生成一个更小的特征图(如9×4大小),抽取局部交互特征。
- 说明卷积核对因子数据的因子合成属性,有效挖掘邻近因子之间的交互效应。
图表7:卷积结果后的处理步骤(页面8)
- 应用ReLU激活函数给予非线性。
- 将二维卷积特征图展平为一维向量,作为输入进入后续全连接层继续特征变换和分类预测。
- 标准CNN流程,保障模型非线性表达能力。
图表10:因子排列示意(页面9)
- 展示两种因子排列方式的区别:
- 左图中,相关因子BP和ROE相邻,卷积核可覆盖两者交互。
- 右图中,该两因子分开,卷积核无法同时作用,限制了相关因子的联合表达。
- 突出因子排列对模型训练和预测产生的实质影响。
图表11:测试流程示意图(页面10)
- 数据到模型评估的完整流程:包括数据获取、特征与标签提取、特征预处理与二维数据生成、滚动训练集与验证集的合成、样本内训练、交叉验证调参、样本外测试和模型评价。
- 系统展现了量化AI模型研发的科学流程,保障结果可信性。
图表15 & 图表16:CNN与全连接神经网络结构图(页面13)
- CNN图清晰展示了输入二维图片、卷积层、激活、多层全连接,最后softmax分类的典型深度网络结构。
- 全连接网络为因子图一维展平输入,贯穿多全连接层,与CNN形成直接对比。
- 便于技术人员理解不同结构设计的差异。
图表17:单因子因子收益率与RankIC统计(页面14)
- 数据显示CNN在多项指标均领先全连接网络及线性回归。
- RankIC(秩相关):13.62%(CNN) > 13.28%(全连) > 12.48%(线性),因子收益率也呈现相似阶梯,显示CNN的预测能力优势。
图表18 & 19:累积RankIC和因子收益率曲线(页面14)
- 展示三模型在8年期间的累积RankIC和因子收益增长趋势。
- CNN曲线始终高于其他两者,表明其因子预测稳定且持续优异。
图表20 & 21:分层测试及TOP组合绩效(页面15)
- 分层测试显示因子越高层组合收益越强,验证因子预测的区分能力。
- TOP组合年化收益20.05%,夏普0.72,信息比4.04,多空组合夏普4.84,均体现CNN因子出色的风险调整后收益能力。
图表24:全A选股策略回测指标(页面16)
- 以沪深300为基准时,CNN年化超额收益约5-6%,不及线性回归,但以中证500为基准时,CNN年化超额收益达13.7%-16.4%之间,远超其它模型;最大回撤小,信息比率和Calmar比率均领先。
- 明确显示CNN对中小盘股票的策略构建能力突出。
图表25 & 26:策略累计超额收益(页面16-17)
- 随时间累计收益的曲线清晰展示了CNN策略持续跑赢市场基准且领先全连接和线性回归策略。
- 表明模型实际落地可实现稳定超额收益的可能及风险控制良好。
---
4. 估值分析
- 本报告主要关注人工智能驱动的多因子选股模型技术研究和实证测试,未涉及股票或企业估值方法的具体讨论。
- 财务估值类指标如ROE等被纳入因子输入,估值指标与深度学习模型共同作用,无单独估值模型构建章节。
- 该研究侧重于模型层面因子合成与筛选优异组合,输出为股票涨跌概率或收益预测,后续依赖传统组合管理方法实现价值。
---
5. 风险因素评估
- 风险提示:策略基于历史经验总结,存在失效风险。
- 模型解释性问题:CNN属于“黑盒”模型,难以解释预测决策过程,增加投资使用风险。
- 市场变化风险:模型对未来市场结构、政策、行情变化的鲁棒性待考验。
- 数据风险:因子质量与完整性直接影响模型训练和预测效果,缺失及异常值处理需谨慎。
- 技术升级速度风险:随着深度学习技术快速迭代,现有模型可能被更优算法替代。
- 报告未详述具体的风险缓解措施,但通过滚动训练、交叉验证等机制降低风险倾向。[page::19]
---
6. 批判性视角与细微差别
- 本报告系统阐述CNN在多因子选股的创新实践,实证表现优异,但需审慎看待如下方面:
- 模型泛化能力未知:只有历史回测验证,未来市场验证结果或不同。
- 池化层省略是否固化设计:因子数据“模糊化”与降维的替代方案可进一步探索,报告未尝试其他降维方式。
- 因子排列重要性虽提及但缺具体方案:只给出一般原则,没有深入算法优化因子排列顺序,可能限制模型提效空间。
- 对比模型参数调优影响未详述:全连接模型参数较CNN略多,报告仅控制参数层数神经元数,调优差异可能影响公平性。
- 回测基准差异显著:CNN在沪深300基准下表现不及线性回归,需分析此差异背后经济和技术原因。
- 缺少对模型计算复杂性和实际应用成本讨论:实时运行和部署难度、资源消耗未提及。
- 总体而言,报告较为客观严谨,但未来需加强模型解释性、泛化验证和技术拓展,确保可操作性和稳健性。
---
7. 结论性综合
华泰证券研究所关于卷积神经网络在多因子选股领域的深度研究报告,以系统完整的结构、详实数据和科学方法论,展示了CNN技术在金融市场量化投资中的应用潜力和实际效果。报告明确指出:
- 结构创新:通过将股票多因子时序数据构建为二维因子图片,借助CNN的卷积运算实现因子的自动合成与特征抽取,具有独特优势。
- 模型设计:采用一层卷积层无池化结构、合理因子排列,结合激活函数和多层全连接神经网络有效学习特征。
- 实证表现:
- 单因子回归、RankIC及分层测试中,CNN生成的因子表现最优,TOP组合年化收益超过20%,多空组合夏普接近5。
- 全A股选股策略以中证500指数为基准时,CNN策略在超额收益、最大回撤、信息比率、Calmar比率等指标均领先全连接神经网络和线性回归,证明CNN合成因子在中小市值股票中策略构建优势明显。
- 前瞻性:报告指出当前CNN技术仍在高速迭代,建议金融领域可以引入更多先进技术如数据增强、残差结构、多尺寸卷积核网络等进行探索。
- 风险观察:强调历史有效性可能不代表未来表现,模型解释难度大,建议投资者及研究者谨慎使用。
本报告不仅加深了金融量化投资领域对深度学习技术的认知,也为今后融合视觉识别领域先进技术与金融投资提供了方法论示范。CNN在多因子选股中的成功应用体现了人工智能与传统金融深度融合的趋势,开启了量化投资向更加智能化与高效化发展的新篇章。[page::0, page::3, page::4, page::5, page::6, page::7, page::8, page::9, page::10, page::11, page::12, page::13, page::14, page::15, page::16, page::17, page::18, page::19]
---
结语
整体来看,本报告通过理论与实证的结合,向读者详细展示了卷积神经网络这一深度学习模型如何在多因子证券选股中实现有效应用。丰富的图表和数据辅助理解,系统的流程设计确保研究的科学性和可验证性。报告充分体现了华泰证券在人工智能量化投资研究领域的领先水准和创新能力,对于量化投资研究者和实务工作者均具有重要启示和参考价值。