【广发金融工程】基于卷积神经网络的股价走势AI识别与分类
创建于 更新于
摘要
本报告创新性提出利用卷积神经网络对图表化的价量数据进行建模,构建I20R20和I20R5两个因子,分别预测未来20日和5日的股价走势。实证表明两因子在2020年2月至2023年2月区间,无论是在全市场还是主要板块中均实现显著超额收益,表明图表化数据和卷积网络在股价走势预测中的有效性与优越性 [page::0][page::1][page::4][page::6]。
速读内容
- 传统基于价量数据的机器学习选股策略通常采用时序模型如循环神经网络(RNN)和Transformer,但这类模型无法有效识别价格和交易量的图形走势形态,限制了预测精度 [page::0][page::1][page::2]。
- 本报告提出构建包含K线图、移动平均线、成交量和MACD指标的标准化价量数据图表,将其作为卷积神经网络(CNN)输入,充分利用CNN在图像识别领域的优势来捕获走势形态信息。

- 卷积神经网络结构设计:
- 输入为大小为20日窗口的价量图表。
- 经卷积处理后获得512×10×10的特征图,展平后送入全连接层输出3类未来收益概率,代表未来收益为跌、平、涨的概率。
- 构建两个模型对应未来5日(I20R5)与20日(I20R20)收益预测,换仓周期与预测期一致 [page::5]。
- 卷积层输出的特征可视化显示,低层卷积层提取了K线、均线、成交量及MACD的整体信息,高层卷积层开始专注于图表中特定的细节区域,有效捕获多维度信息。




- 实证回测结果(2020年2月至2023年2月):
- I20R20因子(20日换仓):中性化后多头对应板块指数的超额年化收益分别为全市场18.82%、沪深300 10.30%、中证500 9.07%、中证800 10.76%、创业板 12.29%、以及其他11.40%。
- I20R5因子(5日换仓):中性化后多头对应板块指数超额年化收益分别为全市场12.34%、沪深300 5.72%、中证500 5.21%、中证800 6.21%、创业板 6.95%、其他 5.89%。
- 分档收益显著,模型能有效产生超额收益,体现了基于图表CNN建模的选股策略优势[page::6]。
- 风险提示:模型和结论基于历史数据构建,存在市场政策、结构变化及交易行为改变导致策略失效的风险[page::0][page::6]。
深度阅读
【广发金融工程】基于卷积神经网络的股价走势AI识别与分类——详尽分析报告
---
1. 元数据与总体概览
- 报告标题:《基于卷积神经网络的股价走势AI识别与分类》
- 作者及研究机构:陈原文、安宁宁、罗军,广发金融工程研究中心
- 发布时间:2023年5月30日16:00
- 研究主题:运用卷积神经网络(CNN)对基于价量数据的股价走势进行预测,构建量化选股策略
- 核心论点:传统基于价量数据的时序模型(如RNN、Transformer)在捕捉股票价格与交易量走势形态方面存在不足,本报告提出利用卷积神经网络对图表化的价量数据进行建模,识别走势形态并对未来股价走势进行有效预测。实证结果显示基于此方法构建的选股因子在多个市场板块均实现了显著的超额收益。
- 目标信息传递:介绍CNN模型在量化选股策略中的应用优势,提供具体因子构建、回测效果与模型视觉化分析,验证其预测效能和实际投资价值。
---
2. 逐节深度解读
2.1 研究背景
(一)基于价量数据的机器学习量化选股策略
- 关键论点:
- 价量数据本质为时间序列,传统机器学习选股策略多用时序模型(RNN、Transformer)。
- 时序模型能捕获数字型趋势信息(涨跌关系),但对价格和交易量的“走势形态”不能有效识别。
- 关键举例:
- 人类投资分析中,往往不直接看数字序列,而观察包含K线图、均线、MACD等的图表形态,这种形态对未来走势的预测更具直观且重视结构信息[page::0]。
- 逻辑与假设:
- 价格和成交量复合的走势形态包含比单纯数字序列更丰富的特征,时序模型结构固化导致难以捕捉这些特征。
(二)模型演进介绍
- 时序模型不足:
- RNN结构演示(图3),通过递归隐藏状态传递捕获时间依赖,但对形态局部空间信息无法充分理解[page::1-2]。
- Transformer通过自注意力机制能处理长序列,提升并行运算效率,较RNN更强,但其本质依然是序列模型,缺乏对空间结构形态的敏感度[page::2]。
- 卷积神经网络(CNN)简介:
- CNN起源于80年代末90年代初,用以图像识别,适合提取空间局部及多层次特征,具有平移不变性和局部连接优势。
- 详细介绍了CNN经典网络结构(如LeNet、VGG16),说明CNN多层卷积及池化层能够分层次抽象图像信息[page::2-4]。
---
2.2 基于卷积神经网络的价量数据图表化选股策略
(一)标准化价量数据图表
- 关键内容:
- 设计了包括K线图、移动均线(如MA5、MA10等)、成交量柱状图、MACD等技术指标的标准化价量图表,窗口为20个交易日。
- 标准化图表不只包含数字,更保留成交量与价格走向的空间视觉结构[page::4]。
- 数据量说明:
- 由于图表结构复杂,全市场2005-2023年数据量达115GB,远超纯序列价量数据(<2GB),表明图形化数据包含丰富信息[page::4]。
- 图示说明:
- 图11清晰展示标准化价量图表,划分为上部价格K线+均线,中部成交量,下部MACD,结构紧凑且信息丰富。
(二)价量数据图表卷积神经网络设计
- 网络结构:
- 输入为标准化图表,经过多层卷积后得到512个10×10的特征图,特征图摊平为51200维向量进入全连接层,最终输出表示未来股价收益的概率分布(跌、中、涨三个区间)[page::5]。
- 输出含义:
- 以三分类概率反映个股未来收益的分位,利用“上涨概率”作为选股因子(I{x}R{y}表示以x日图表预测未来y日收益)。
- 训练细节:
- 使用Xavier初始化,Adam优化器,早停策略以防止过拟合。
- 换仓周期:
- 因子I20R5和I20R20分别预测未来5日和20日收益,对应换仓周期相同,体现策略的交易节奏配合[page::5]。
(三)特征可视化分析
- 分析目的:
- 验证CNN模型是否能有效捕获图表中的价量形态信息,以及不同卷积层提取特征的差异。
- 结果说明:
- 卷积层1、2聚焦于整体信息吸收,覆盖K线、均线、成交量及MACD,低层特征较为综合。
- 卷积层3、4特征开始分化,一些特征专注于价格走势(K线+均线),另一些则重点识别成交量和MACD信息,同时存在关注全局结构的特征。
- 结论:
- 显示CNN结构能有效提取并区分价量数据复杂信息,实现形态识别和未来走势映射[page::5-6]。
- 图示:
- 图13至16展示不同卷积层的特征图,颜色深浅代表激活强度,直观反映模型对关键走势信息的“捕捉”能力。
---
2.3 实证回测与策略表现
- 样本外区间:2020年2月至2023年2月
- 回测设计:
- 双边千三交易费用计入,分别采用20日和5日换仓周期对应I20R20和I20R5因子。
- 市场中性化处理前后效果均报告。
- 收益表现:
| 因子 | 换仓周期(天) | 收益率 (全市场) | 沪深300 | 中证500 | 中证800 | 创业板 |
|------|--------------|-----------------|---------|---------|---------|---------|
| I20R20(中性化前) | 20 | 21.06% | 8.76% | 10.70% | 12.04% | 11.62% |
| I20R20(中性化后) | 20 | 18.82% | 10.30% | 9.07% | 10.76% | 11.40% |
| I20R5(中性化前) | 5 | 15.93% | 9.77% | 3.79% | 8.76% | 11.32% |
| I20R5(中性化后) | 5 | 12.34% | 5.72% | 5.21% | 6.21% | 5.89% |
- 解读:
- 两种因子均在各市场中呈现稳定显著的超额年化收益,20日周期因子收益率普遍高于5日周期。
- 中性化处理体现考虑了行业市值影响,依然保持较强的收益能力,说明模型捕捉的形态信息具有较好的普适性和稳健性[page::6]。
---
2.4 风险提示
- 模型与策略风险:
- 基于历史数据统计建模,未来市场环境、政策调整可能导致模型失效。
- 市场结构变化以及交易行为改变也可能使策略表现下降。
- 策略稳定性提醒:
- 风险的存在强调投资需关注模型假设的时效性和适应性,投资者应警惕“历史表现不代表未来”[page::0,6]。
---
3. 图表深度解读
图1、图2及图11:价量数据图表示例与标准化构建
- 图1展示了Wind平台上某股票20日行情的K线、均线和MACD图表;
- 图2及图11展示报告中用作CNN输入的标准化价量图表,结构细分为K线与均线区域、成交量柱状图和MACD指标区。
- 标准化图表通过统一尺寸和标准化尺度保证模型输入一致性,同时涵盖丰富的技术指标信息,为CNN提供全面、形态化的视觉数据。
- 数据采集范围长,存储规模远大于传统序列数据,体现模型对更高维数特征的依赖[page::1,4]。
图3:循环神经网络示意结构
- 展示了RNN的时间序列节点处理流程,隐藏层状态依序迭代更新。
- 说明虽然RNN能捕获序列间时间关联,却难对形态空间特征进行有效捕捉,限制其在价量数据形态识别的效用[page::2]。
图4:Transformer网络结构示意
- 描述了Transformer架构及多头注意力机制,展现其长序列建模优势。
- 依然是序列输入输出,缺乏空间形态理解能力,故不能满足形态识别需求[page::2]。
图5、图6:卷积神经网络结构(LeNet-5、VGG16)
- 图5和图6分别介绍了卷积神经网络两个经典架构,体现多层卷积层和池化层堆叠提取图片特征,最后通过全连接层输出分类结果。
- 此结构启示本报告中CNN应用于价量“图表”,可层层提取走势形态信息,实现对未来股价走势的分类预测[page::3,4]。
图13-16:模型各卷积层特征图可视化
- 低层(卷积层1、2)特征图显示出对整体图表信息的反映,包含多维信息。
- 高层(卷积层3、4)特征变得更具针对性,体现出不同特征图“专注”价格走势或成交量、MACD等细分信息。
- 通过这些可视化结果,验证卷积神经网络对价格和交易量图表形态的识别能力,支持模型的预测有效性[page::5-6]。
---
4. 估值分析
本报告主要聚焦于量化选股策略的预测模型研发与实证,未直接涉及企业估值方法及目标价分析,因此无相关估值模型详述。
---
5. 风险因素评估
- 政策环境风险:现有模型基于历史市场环境,如果市场政策出现重大变动,模型规律可能失效。
- 市场结构变化风险:市场参与者行为、结构变化可能涉及量价关系变化,影响模型信号稳定性。
- 交易行为改变风险:投资者交易方式的改变(如算法交易普及)可能使原有模式不再适用。
- 缓解策略未显著说明:报告未披露具体风险缓解措施,提示投资者需对策略适用环境保持关注,密切监控市场动态和模型表现。
整体说明报告作者对策略稳健性持审慎态度,强调动态验证和风险意识的重要性[page::0,6]。
---
6. 批判性视角与细微差别
- 创新之余,模型可能仍受限:
- 报告明确指出时序模型无法捕捉形态信息,但未深入比较其他更高级时序-空间混合模型,如时序卷积网络(TCN)或图神经网络(GNN),这部分对比空缺。
- 特征可视化虽具证明力,但缺乏量化解释:
- 可视化表明不同层提取特征,但未展现对应特征具体如何影响预测效果,缺乏对高关注特征的定量敏感度分析。
- 报告假设切换:
- 假设走势形态信息能显著提升预测,基于CNN图表建模实现,但未详细讨论不同市场环境中形态特征的稳定性。
- 市场环境适应性是潜在挑战:
- 尽管风险提示详尽,策略面对极端事件或结构性断裂时的表现尚不明确。
- 数据处理及模型规模:
- 标准化图表数据量巨大,训练成本及实际应用的计算资源需求未提及,实际落地难度可能较高。
总体上,报告创新性显著但在模型比较和风险细节方面尚有完善空间。
---
7. 结论性综合
本篇专题报告系统地阐述并验证了基于卷积神经网络(CNN)对标准化价量数据图表进行建模以预测未来股价走势的选股策略。通过精心设计的图表化数据输入,结合多层卷积与全连接结构,模型能够有效识别价格与交易量走势的形态特征,克服传统时序模型(RNN、Transformer)对空间走势形态捕捉的不足。
- 通过对CNN不同卷积层的特征可视化,确认模型在低层全面捕捉图表信息,高层实现特征分化,体现对价格、成交量及MACD不同信息的区分能力。
- 在2020年2月至2023年2月的样本外回测中,利用I20R20和I20R5两个因子分别在5日和20日换仓周期进行多市场实证,均实现了显著且稳健的超额收益。
- 中性化处理后的因子依然表现出强劲的收益能力,说明因子有效抑制了行业市值因素的影响,具有较好普适性。
- 风险提示强调模型和策略面临政策、市场结构及交易行为变化所带来的失效风险,提醒投资者关注动态环境对模型的适用性。
该研究不仅丰富了量化选股策略在价量数据建模领域的方法论,亦为机器学习在金融领域形态识别应用提供了有效示范。图表化价量数据与CNN深度学习的结合,为未来金融机器视觉分析提供了有力工具。
综上,作者的立场明确且稳健:推荐基于卷积神经网络的形态识别量化选股策略作为有效多头超额收益来源,评估其长期应用潜力,但同时提示对应的市场风险与策略局限。
---
附:重要图示引用
- 标准化价量图表示意(图2、图11)


- RNN结构(图3)

- Transformer结构(图4)

- LeNet-5和VGG16 CNN架构(图5、图6)


- 特征可视化(图13-16)




---
参考页码标识:[page::0,1,2,3,4,5,6]
---
本分析遵循报告全篇结构,细致剖析与解读了报告的研究思路、关键论点、模型设计、实证结果及风险提示,配合图表视觉化内容实现对深度学习量化应用的全面展现。