基于循环神经网络的选股模型初探
创建于 更新于
摘要
报告利用循环神经网络(RNN)构建选股模型,测试多种输入特征、模型结构及训练方式的效果。结果显示,特征集2综合表现最佳,特征集3稳定性最优,GRU模型结构稳定性和通用性强,模型更新频率需与特征集匹配。调整预测标签和样本抽样方式对绩效影响显著。模型训练和回测覆盖2017年至2023年,回测验证多空组合均有良好收益与稳定性,具备一定实用价值[page::0][page::13]。
速读内容
循环神经网络选股策略框架及特征处理 [page::2][page::3]
- 利用RNN捕捉时序信息,截面选股自然适合多输入单输出结构。
- 构建4个特征集,覆盖不同采样频率与信息复杂度,日频和分钟频数据结合进行预处理,包括序列截取、时序变换、截面变换及缺失填补。
- 特征集2(分钟数据统计量)表现综合最优,[page::3]
模型结构与训练设定 [page::4][page::5][page::6]
- 采用GRU、LSTM、A-GRU三种模型结构,GRU参数最少训练最快,A-GRU引入时序注意力增强时序感知。
- 训练采用滑动窗口滚动更新模型,时间跨度2007-2023年,主要以年频为更新频率。
- 优先采用相关性损失函数(IC损失)、排序损失(RankNet、ListMLE)适合低信噪比量化选股环境。
- 样本抽样设计支持完全随机与同期抽样,后者更符合时间序列特性。

初步测试:训练长度、抽样方法、损失函数及标签设计影响绩效表现 [page::7][page::8][page::9]
| 模型设定 | Rank IC | ICIR | IC胜率 | 多空收益(%) | 夏普比率 | 最大回撤率 | 多头超额收益(%) | 平均换手率(%) |
|-----------------|---------|------|---------|-------------|-----------|-------------|---------------|----------------|
| 训练长度4年 | 11.17% | 1.33 | 90.1% | 8.95 | 5.8% | 17.4% | 65 | 63~67 |
| 训练长度8年 | 11.59% | 1.46 | 93.5% | 9.34 | 4.6% | 15.7% | 67 | |
| 抽样方式(同期乱序优于完全随机) | | | | | | | | |
| 目标函数-IC优于RankNet和ListMLE | 11.59% | 1.46 | 93.5% | 9.34 | 4.6% | 15.7% | 67 | 67 |
| 预测标签次日均价、5日跨度表现优 | | | | | | | | |
- 特征序列长度(30、60、90日)对绩效影响不显著。
- 小样本范围和特征调整对特定特征集有提升效果。[page::7][page::8][page::9]
综合测试:特征集对比及模型更新频率影响 [page::9][page::10][page::11][page::12]
- 特征集2表现最好,兼顾收益与换手,特征集3稳定性最高。
- 模型更新频率极端高低均不优,年更新为合理折中。
- GRU模型结构在整体表现及稳定性上优于LSTM和A-GRU,复杂结构非必然优于简单结构。
- 缩减训练样本范围对特征集1和2在某些指数域表现有益。

核心结论总结 [page::13]
- 预测标签及样本抽样方式关键影响模型绩效。
- 以分钟级统计特征(特征集2)表现最佳,日频复杂因子(特征集3)稳定性优。
- 简单GRU结构适用性强,模型更新频率需根据特征集特性权衡。
- 缩减训练样本范围有利于提升特定指数域股票表现。
- 研究基于历史数据,存在未来失效风险,投资需谨慎。[page::13]
深度阅读
基于循环神经网络的选股模型初探——详细分析报告
---
1. 元数据与报告概览
报告标题: 基于循环神经网络的选股模型初探
作者: 陈升锐、王西之
发布机构: 中信建投证券股份有限公司
发布日期: 2023年7月2日
研究主题: 金融产品领域,聚焦基于循环神经网络(RNN)的选股策略模型构建与性能测试。
核心论点与目标:
本报告基于循环神经网络(RNN)构建截面选股模型,重点测试输入特征类型、模型结构、训练方式及参数调整对模型选股绩效的影响。通过多阶段测试,确定了预测标签、样本抽样方法、特征集选择及模型更新频率对绩效有显著提升效果,发现GRU结构与特征集2的综合表现最优,同时强调模型更新频率需和特征集特性契合,简约模型结构更具稳定性与泛化能力。最终,报告警示基于历史数据的模型未来效果存在不确定性风险。
从市场表现图来看(图1),国债指数表现稳健上扬,而同期上证指数呈现较大波动并整体偏负,表明市场环境较为复杂,选股模型面临挑战且效果体现有意义 [page::0]。
---
2. 逐节深入解读
2.1 前言章节(第2页)
关键论点
- 聚焦构建基于RNN的端到端选股模型,通过对输入特征类型(信息复杂度、生成频率)、模型参数(网络结构、超参数)和训练方式(样本抽样、目标函数等)多方面测试,提升选股绩效。
- 结论涵盖对预测标签调整、样本处理、目标函数选择、网络容量保证、特征集选择、模型更新时间选择和模型复杂性等多方面验证,并得出简洁模型和适配特征集的更新频率更优的见解。
支撑逻辑
- RNN内部循环结构更契合时序数据特点,能捕获长期时序信息。
- 针对截面选股,不同信息频率和复杂度的特征集,结合多样网络结构,构成多方位实验框架。
- 通过性能指标(IC、分组回测等)反复测试不同设计选项。
专业解释
- IC(信息系数)为因子排名相关系数,反映模型排序相关性,是衡量选股因子有效性的核心指标。
- 模型更新频率指模型重新训练或调优的时间间隔,影响模型对市场变化的适应能力。
- 预测标签为预测目标,此处通常用未来区间收益率计算。

图1显示传统神经网络(NN)和RNN的区别,将RNN展开后每个时刻隐藏层带有前后时间串联信息,体现序列信息特征,更适合金融时序数据建模 [page::2]
2.2 选股模型框架(第3-5页)
2.2.1 特征集与处理流程(第3页)
- 四种特征集设计对比:
- 特征集1:日频原始行情,10个特征,如收盘价、开盘价等。
- 特征集2:分钟频原始信息生成的日频量价统计量,22个特征,例如分钟收盘价均值、偏度等。
- 特征集3:分钟频数据衍生的复杂量价因子,21个特征,如买卖流动性因子、订单失衡指标等。
- 特征集4:30分钟频原始数据,8个特征。
- 特征处理四步流程:
1. 序列截取:日频特征默认30天长度,30分钟频率数据取10个时间段共80长度。
2. 时序变换:对价格类特征去量纲并保留时序信息。
3. 截面变换:分布变换、异常压缩及标准化,确保不同特征尺度统一。
4. 缺失填补:针对序列中的少量缺失数据做合理填补,保证样本完整性。

该流程确保不同频率、复杂度的特征均被有效标准化处理后输入模型,提高训练稳定性及准确性 [page::3]
2.2.2 模型结构(第4页)
- 传统RNN存在梯度消失和长期依赖捕捉不足问题,常用替代为LSTM和GRU结构。
- LSTM含细胞状态和多个门控单元(遗忘门、输入门、输出门),复杂但能强力保留关键信息。
- GRU结构简化为两个门(重置门、更新门)和单一隐藏状态,参数更少、训练更快且效果相近。
- 本报告基于简单GRU为基础,衍生出LSTM和带时序注意力(A-GRU)模型,具体结构如下:


左图显示LSTM的多门控机制和GRU的简化版门控,右图比较了GRU简单结构和引入时序注意力增强的A-GRU,后者可自适应聚合不同时间步信息,理论上强化序列时变察觉能力 [page::4]
2.2.3 模型训练(第5-6页)
- 样本时间跨度2007-2023年,预测从2017年开始,采用滑动滚动窗口训练。
- 训练集和验证集分别用于拟合和早停,模型年频更新截取过去四年数据用于训练,当前年验证,预测下一年。
- 目标函数采用排名相关损失,如IC损失(Spearman相关系数反向优化)、RankNet排序损失(成对比较排序)、ListMLE(基于序列概率的总体排序损失)。
- 抽样设计:
- 批模式1:完全随机混合不同时间的样本。
- 批模式2:同一期样本混合,兼顾差异和可比性。
- 批模式3:同一期序列且批次有先后顺序。



训练设计系统完整考量了时间序列特征和排序优化特性,确保训练过程具备现实可操作性和模型泛化能力 [page::5][page::6]
---
3. 选股效果测试(第7-12页)
3.1 测试设定(第7页)
- 预测结果按周频输出,作为深度学习因子,统一做标准化和中性化处理。
- 采用10组分组等权回测,计算多空组合收益及多头超额收益。
- 股票池涵盖全市场等多指数,剔除新股、停牌、ST及涨跌停股票,成交价取次日均价,不含交易费率。
3.2 初步测试(第7-9页)
| 重点对比点 | 主要结论 |
|-|-|
| 训练数据长度(4年 vs 8年) | 双方表现相近,8年训练IC表现稍优,4年训练多头超额收益略高。 |
| 特征序列长度(30/60/90日) | 影响不大,序列延长无显著性能改善。 |
| 抽样方法(随机 vs 同期乱序) | 同期乱序抽样多头超额表现更好。 |

- 损失函数测试(图表10):IC损失表现最好,RankNet略逊,ListMLE最低但换手也最低。
- 预测标签设计(图表11):次日收盘价及均价标签在短期(5日)表现优于当收价和次开价,且拉长预测跨度降低换手,性价比更优。
- 网络结构参数(图表12):维度过低限制性能,16维表现最差;高维度(64~128)提高少,但训练效率下降,推荐平衡选择32~64维;2层GRU优于1层,增加层数收益有限,128维较64维边际效益递减。
3.3 综合测试(第9-12页)
- 不同特征集对比(图13):
- 特征集2综合表现最佳(IC、收益及换手均优)。
- 特征集3稳定性和夏普率最高。
- 特征集4表现明显落后。
- 序列加倍长度带来些许绩效提升,但幅度有限。
- 模型更新时间频率影响(图14):
- 大多数特征集年度更新为折中较优选择。
- 高频更新并非越好,如特征集1高频反降,特征集4反之适合较高频次。
- 模型结构比较(图15):
- 简单GRU在多数区域表现优于或相当于LSTM及A-GRU,复杂结构在沪深300与中证500表现下滑。
- 特征集2在所有样本池均表现出色。
- 特征集3在中证1000表现尤佳,夏普率明显领先其他特征集。
- 缩小训练样本域测试(图16-19):
- 缩至中证1800样本范围对特征集1、2特定指数域有小幅提升,多空收益和多头超额收益均改善。
- 特征集3、4缩样训练无明显增强,特征集4表现依旧整体偏弱。
---
4. 图表详细解读示范
以图表13(综合测试1)为例:
- 描述: 展示了4个特征集在不同序列长度下的IC回测表现和分组回测绩效。
- 趋势解读: 特征集2在Rank IC(11.04%)、ICIR(1.28)、夏普率(9.61)等关键指标上领先,且换手率较低(47%-48%),说明该特征集以更少的交易频率获得更优的收益和风险调整收益。特征集3虽IC稍低但稳定性指标ICIR和胜率较高,突显其在收益波动控制上的优势。特征集4则整体表现欠佳,可能因信息复杂度和频率不匹配所致。序列长度延长并未显著改变排名或收益水平,显示模型对过长序列敏感度较低。
- 支持文本结论: 此图支持报告推断“特征集2综合表现最优,特征集3稳定性最佳,特征集4全面落后”的结论 [page::9]。
---
5. 估值分析
本报告主要研究模型构建、参数调优及选股绩效测评,未具体涉及对金融资产或目标公司的传统估值分析因此无估值模型部分。
---
6. 风险因素评估
报告明确指出:
- 历史数据依赖风险:模型结果基于历史数据,未来有效性不保证,过度拟合风险存在。
- 市场系统性风险:政策变动、宏观经济波动引发的系统性风险影响模型稳定性。
- 数据缺失及统计偏误:少量缺失值存在可能扩大统计误差。
- 模型假设简化风险:实际市场交易费率、流动性限制等未纳入考量,模型结果与真实效果可能存在偏差。
报告未具体给出风险缓解方案,仅强调模型应结合实时市场动态进行动态调整并警惕假设局限性。显现出作者对模型局限稳健的认知态度 [page::0][page::13]。
---
7. 审慎视角与细微差别
- 模型复杂度与性能权衡:报告多次提及简单结构GRU优于更复杂的LSTM和A-GRU,表明在金融时序截面选股中,过度复杂网络未必带来稳定提升,突显金融序列数据特点与模型匹配问题。
- 特征集设计适应性:不同特征集基于信息频率和复杂度不同,对应模型更新时间也不同。过于频繁或稀疏更新均会影响效果,提示实际应用需个性化调试。
- 潜在偏差:测试数据以2017年开始为主,金融市场样本窗口相对有限,部分结论可能受样本区间特定市场态势影响,通用性需谨慎判断。
- 性能指标多维兼顾:除收益率外引入IC胜率、ICIR、夏普率、换手率、最大回撤率等多指标综合评价,体现专业全面的模型评价方法。
- 图表中数据细节:部分综合测试数据中不同样本范围影响细微且指标波动复杂,提示模型性能受训练样本组成细节影响较大。
---
8. 结论性综合
本研究系统地构建并测试了基于循环神经网络的截面选股模型,涵盖了特征集设计、模型结构、训练方式和样本抽样等关键环节。综合来看:
- 最佳特征集与模型结构:
- 特征集2(基于分钟频数据的量价统计特征)综合表现最优,兼顾收益和换手效率,具备较强泛化能力。
- 特征集3(复杂量价因子)在稳定性和风险调整收益(夏普率)方面表现突出,尤其在中证1000主体区域优势明显。
- 特征集4整体表现不理想,信息频率与处理方式或未充分兼顾模型需求。
- 简单的GRU结构模型相较于复杂LSTM与含注意力机制的A-GRU,更加稳定且具域通用性,符合金融数据噪声大、信号弱的特性。
- 训练及更新策略:
- 预测标签设计(未来5-10日次收盘价收益)及采样方法(同期乱序批次)对模型性能提升显著。
- 模型更新频率需匹配特征集属性,年度更新为较合理折中。过频或过少都可能导致性能下降。
- 适当缩减训练样本范围(如中证1800)能针对特定指数域带来小幅提升,显示样本精准匹配的重要性。
- 图表洞察:
- 图表9-12系统展示参数调优的细节效果,为确定最终模型参数组合提供了全面数据支持。
- 图表13-19综合比较特征集、模型结构、训练范围与更新时间,多维度验证结论稳定性。
- 市场表现对照图显示模型是在市场波动期构建,绩效验证具有一定实用性意义。
- 风险提示及限制:
- 研究基于历史数据,无法保证未来适用;政策和宏观风险,数据缺失及模型简化假设是主要潜在风险点。
- 模型性能受训练样本的时间长度及覆盖范围影响,实际应用需动态调整并结合市场环境。
总体而言,本报告通过严密的方法论检验与数据实证,展示了基于循环神经网络的深度学习选股模型在中国市场的应用潜力,特别是在合理配置特征集和模型设计、优化训练流程后可获得稳健选股信号。报告结论指向以简洁的GRU结构配合高信息频率和适宜训练更新策略为较优选项,具有较强行业应用参考价值。
评级提示: 本报告关注模型方法探索,无明确投资评级,不构成直接的买卖建议。风险声明强调模型历史验证特性限制及市场系统性风险[page::0][page::2][page::3][page::4][page::5][page::6][page::7][page::8][page::9][page::10][page::11][page::12][page::13]。
---
结语
本次基于循环神经网络的多维度选股策略研究,以扎实的数据支撑和详尽的模型测试为基础,为量化投资领域提供了有效的策略构建思路与实证验证,尤其在处理时序复杂金融数据时展现出深度学习模型的独特优势。未来随着数据规模和处理能力提升,结合更多不同数据源和模型结构,有望进一步增进策略绩效并拓展应用边界。
---
参考图片展示
- 市场表现(国债指数与上证指数)

- RNN结构示意图

- 特征处理流程

- GRU与LSTM结构对比

- GRU和A-GRU模型结构

- 批抽样示意图

---
(全文完)