递归神经网络 RNN—自适应计算次数(ACT)的 RNN 增强
创建于 更新于
摘要
本报告聚焦递归神经网络(RNN)在多因子量化选股中的应用创新,提出通过自适应计算次数(ACT)提升RNN复杂度,显著加快训练收敛速度并提高多空仓位区分度及收益表现。报告系统优化数据输入结构,尝试相对收益标签、精选少量代表性因子(12个)及缩减时间步长等方法,进一步提升模型稳定性和效果。同时基于A股多因子数据回测,验证ACT-RNN模型在看多组合准确率及收益率方面均优于传统LSTM模型,尽管中性组合预测仍表现较弱,且预测看多股票偏多,且市场趋势影响模型效果显著。上述研究为深度学习方法在中国股票市场多因子选股提供新思路和实证支持[page::0][page::3][page::5][page::11][page::12][page::13][page::14]。
速读内容
报告背景与目的 [page::3]
- 机器学习与深度学习技术被引入量化投资领域,传统RNN、LSTM模型已证明具备一定选股能力。
- 本报告旨在通过增强RNN结构提升多因子选股模型性能和预测效果。
RNN及LSTM模型介绍及可视化结构图 [page::4]


- RNN具备时间序列记忆能力,LSTM通过特殊Cell结构解决了长期依赖问题,提升预测稳定性。
数据输入优化尝试与效果对比 [page::5][page::6][page::7]




| 时间跨度 | 看多收益区分度 | 备注 |
|-----------|------------|----------------|
| 48因子 | 一般 | 多因子共线性较高 |
| 12因子 | 提升显著 | 代表性更强,优化共线性 |
| 24个月特征 | 效果略好 | 主要使用的历史长度 |
| 12个月特征 | 无明显差别 | 缩短历史长度尝试 |
- 相对收益标签分法使结构更明显但收益率无大差异,缩减因子维度从48至12显著提高多空区分效果。
- 5分类标签表现不及3分类,复杂划分未改善预测性能。
ACT-RNN算法结构及流程详解 [page::7][page::8][page::9][page::10]




- ACT通过自适应计算次数机制增加网络对单步数据重复学习次数,提升网络深度与表达能力,解决梯度消失问题。
- 预测输出通过权重(halting neuron)自适应加权不同计算步数的结果,实现高效复杂度调节。
ACT-RNN多因子选股模型参数及回测表现 [page::11][page::12][page::13]




- 训练阶段ACT模型收敛快于LSTM,迭代次数约减少30%。
- 多、空、中性组合收益曲线分叉明显,ACT模型看多组合收益明显优于LSTM。
- TOP100看多组合真实准确率约15%,表明预测与实际优胜匹配度一般。
- 看多组合占比均值约42%,略高于同期沪深300上涨超30%股票占比33%,表明模型偏多配置。
- 看多占比与下一期市场涨跌表现相关,组合上涨胜率约75%。
结论与展望 [page::14]
- ACT自适应计算次数机制有效提升RNN模型多因子选股性能,尤其是区分度和利用收益表现。
- 数据输入端优化虽有进步,但预测中性档依然存在困难,需要持续改进。
- 深度学习模型结构复杂度提升是趋势,但数据质量和处理仍为关键瓶颈。
- 本研究成果具备较强实操意义,为未来深度量化投资模型研究提供技术路径和经验借鉴。
深度阅读
报告详尽分析:递归神经网络RNN—自适应计算次数(ACT)的RNN增强专题研究
---
一、元数据与概览
- 报告标题:递归神经网络 RNN—自适应计算次数(ACT)的 RNN 增强
- 报告类型:证券研究报告—深度专题报告
- 发布机构:国信证券经济研究所
- 发布时间:2017年8月11日
- 分析师:陈镜竹,黄志文
- 主题领域:金融工程,数量化投资,多因子选股模型及深度学习算法改进
- 核心论点:基于递归神经网络(RNN)的多因子选股模型存在长期依赖难以高效捕获的问题,提出引入自适应计算次数(ACT)机制,提高RNN模型复杂性和学习表现。通过实证验证,ACT增强后的RNN模型较传统LSTM模型在收敛速度和选股收益表现均有所提升,尤其在多空组合收益区分上更为明显;同时,对输入数据结构调整(如收益标签、因子数量、时间步长等)的效果有限,提示数据处理依然是深度学习模型优化的重要方向。
- 分析师结论:ACT增强结构是有效提升RNN选股模型表现的可行路径,且模型输出的多头股票比例与市场整体涨幅的相关性较强,市场趋势影响模型表现。投资评级方面,报告仅提出模型效果分析,具体买卖评级未直接给出,但报告重申模型改进和选股准确度同步提升具有潜力。
- 报告目的:深化探讨基于RNN的深度神经网络多因子选股模型的改进方向,重点研究通过ACT机制提升模型计算深度和复杂度,进而优化选股效果,同时对比不同数据结构处理对模型的影响。
---
二、逐节深度解读
2.1 引言部分及背景介绍
- 内容总结
报告首先介绍深度神经网络、机器学习在投资领域中的应用背景,并强调深度神经网络算法的严谨性及投资数据结构的适配性。继而引入递归神经网络(RNN)并简述其区别于传统神经网络的关键特点——时间序列依赖与信息的持久记忆性。
- 逻辑说明
递归神经网络通过在网络中引入时间循环,信息由当前状态和历史状态共同决定,解决传统神经网络难处理时间序列数据的问题,如股票价格随时间变化难以用静态模型准确预测。
- 阐释关键概念
介绍“感知机”与“多层前馈网络”,“误差逆传播算法”(BP算法)和梯度下降法为神经网络训练核心机制,说明隐藏层神经元数量是确定模型能力的关键参数,通常通过试错方式确定。
- RNN 特点说明
RNN模型引入循环连接,可以捕获时间序列间的依赖关系,且体现为人类判断的先验经验影响当前决策的能力。
[page::0,3]
2.2 LSTM网络的介绍与结构
- 关键论点
由于原始RNN在处理远距离信息传递时存在梯度消失和学习效率低的问题,介绍LSTM网络,通过设计特殊的“cell结构”解决长期依赖问题。LSTM的隐含层设计以多个门控机制控制信息流动,增强记忆和遗忘能力。
- 技术细节
LSTM将隐含层细胞分解为多个线性组合单元,通过控制门决定信息是否传递到下一步,从而避免梯度消失,提升模型对长期依赖关系的捕捉能力。
- 图表说明
图1展示基本RNN展开形式;图2展示LSTM隐含层结构中复杂的门控控制,显示每层计算单元的内部构成。
- 影响与意义
LSTM显著提升了RNN在时间序列预测上的性能,适合多因子选股中的长期数据建模。
[page::4]
2.3 参数设定及数据端改进尝试
- 实验设计
- 时间区间划分明确,回测样本丰富(2007.5-2016.4);
- 所用特征为过去24个月的时间步长数据,入选因子48个,后尝试缩减至12个代表性因子;
- 收益率采用三分类方案(上涨>3%,下跌<-3%,中性区间)及扩展至五分类(细分涨跌幅);
- 投入模型的其他参数包括batch size=1000,隐层神经元数量400,学习率0.0001,犹豫阈值0.1,最大计算次数30等。
- 数据改进尝试与实验结果概述
- 相对收益标签相较于绝对收益标签,改善了标签结构均衡性但对提升模型预测效果有限;
- 因子数量从48降至12,显著提升了模型区分能力与表现,说明减少共线性特征有助于提升模型泛化能力;
- 时间步长缩短从24月至12月,效果相近,说明对时间长度敏感度较低;
- 增加分类数从3至5档,反倒表现下降,三分类较实际问题更适合。
- 数据图表深解
- 图5、6~图13多幅对比收益曲线直观展示了以上改进的效果,主要体现收益曲线多空分化的清晰程度及整体涨幅趋势,特别12因子模型收益曲线相比48因子模型更稳定且上涨空间更大。
- 数据端改进结论
数据端的一系列改进虽发挥作用,但对模型最终的显著提升效果有限,尤其中性档的正确识别依旧困难。
[page::5,6,7]
2.4 ACT机制及其算法改进
- ACT机制介绍
- 传统通过增加层数深度提高学习能力,在RNN中遇到梯度消失难题;
- ACT(Adaptive Computation Time)提供了新的思路:在同一时间步中迭代多次数据处理,而非一次前馈,使模型自适应控制计算深度。
- 结构和工作原理详解
- 图3~图9详细展示ACT-RNN架构,重点是单时间步多次循环迭代的隐层处理,以及由“halting neuron”通过sigmoid函数动态决定迭代终止的机制;
- 迭代次数可动态调整,最大不超过起设定阈值,提升了模型复杂度。
- 技术归纳
ACT通过计算“halting probability”来权衡每步计算的贡献,进而得到加权输出值,是RNN深度优化的创新实现。
[page::7,8,9,10]
2.5 ACT-RNN多因子选股模型实证
- 模型参数与设计
- 保持与前模型一致的时间窗口、因子数、分类方法;
- 输入样本数量庞大,网络参数与训练配置合理。
- 训练性能对比
- 训练准确率收敛速度明显提升,传统LSTM约需7000次迭代收敛,ACT模型在5000次以下收敛(图10);
- 说明ACT提高了神经网络的学习效率。
- 选股收益表现
- 收益曲线(图11)显示,ACT模型三分类(多头、中性、空头)曲线区分度明显高于LSTM,尤其多头组合净值最高且波动性较为合理;
- 说明模型对涨跌预测的分辨力得到加强,提升了实际选股收益表现。
- 选股准确率分析
- 选取概率最高的100只“看多”股票作为选股依据,与实际涨幅前100股票进行对比(图12);
- 平均准确率约为15%,明显低于训练准确率,反映选股任务复杂,准确率与实际组合表现有差距。
- 看多股票组合比例与市场指数关系
- 看多组合股票比例平均约42%,高于HS300指数中上涨比例(约33%)(图13);
- 从月涨跌幅对比显示,模型预测的看多股票比例与次期市场涨跌有较高一致性,涨幅高对应看多比例高,市场趋势对模型有明显影响,胜率约75%。
- 总结实证结果
ACT强化了模型学习动力,提升了收敛速度和多空收益分离能力,从而带来更优选股表现;但实际选股准确率仍有较大提升空间,且模型输出带有市场趋势依赖性。
[page::11,12,13]
2.6 结论部分
- ACT机制通过增加同批数据重复学习次数,有效增强了RNN模型的复杂性和预测区分力。
- 相较传统LSTM,ACT模型在收益区分度、准确率及选股收益上均有改进。
- 数据端的结构优化如收益标签、因子数量调整和时序长度缩减虽有部分改善,但未能带来根本质变,特别是中性类别的预测失败仍是弱点。
- 强调未来研究应继续双管齐下,既关注网络结构提升,也重视数据端特征工程和标签构造的持续探索。
[page::14]
---
三、图表深度解读
图1 & 图2:RNN与LSTM结构示意(页4)
- 图1展示了RNN的循环体与展开图,指出信息在时间序列中逐步传递的机制。
- 图2具体解剖了LSTM隐含层中多门控元件动作(输入门、遗忘门、输出门),体现处理长期依赖的技术细节。
- 两图直观解释了传统RNN天然短板及LSTM设计创新点,为后续方案的技术升级奠定基础。
图5~图9:ACT-RNN结构详解(页8-10)
- 详细分步展示ACT的单步结构,说明如何实现自适应计算次数(halting neuron及其阈值控制);
- 通过sigmoid函数动态产生权重,实现输出的加权求和,自动确定计算停止点;
- 除提升计算深度,ACT还承担优化训练过程梯度传播等机器学习难点的任务;
- 图9对比传统RNN结构,强化了ACT在时间步计算复杂性上的突破。
图10:训练准确率曲线(页12)
- 蓝色LSTM与黑色ACT训练准确率对比,显示ACT收敛更快,更高效地达到接近100%训练准确率。
- 反映ACT增强了模型的学习能力与计算效率。
图11:ACT选股收益曲线(页12)
- 以指数1为基准,灰色(多头)、深蓝色(中性)、浅蓝色(空头)三条收益曲线明显分离。
- 多头组合股价明显上涨,空头组合表现下跌,强化了该模型在实际选股方向的区分效果。
图12:看多组合TOP100准确率(页13)
- 柱状图波动较大,平均准确率仅约15%。
- 说明模型尽管训练准确率高,但实际选股方向的预测能力仍有限。
图13:看多组合占比与HS300月涨跌幅对比(页13)
- 折线表示看多组合占比,柱状图表示HS300月涨跌幅;
- 观察到二者有一定同步趋势,涨幅较大月份看多比例普遍提高,验证市场趋势对模型选股策略的影响。
---
四、估值分析
- 报告主体为技术和模型改进研究,没有单独涉及传统的投资标的估值分析方法(如DCF、PE等)或目标价预测。
- 估值隐含在多因子模型构建及选股效果的提升中,主要体现为提高多空组合的收益表现和准确率,间接提升组合投资的预期收益率。
---
五、风险因素评估
- 风险提示(第15页)明确指出:
- 研究数据尽管来自合规渠道,但不保证信息完备准确;
- 报告结果不保证未来表现,存在不确定性;
- 深度学习模型本身可能存在过拟合、市场结构变化风险等;
- 投资者应基于自身风险承受能力判断,报告不构成投资建议。
- 报告中未具体详述模型特有风险,但理论上包括:
- 神经网络模型复杂,训练过程和参数敏感性高;
- 多因子选股依赖历史数据,市场环境突变可能导致模型失效;
- 模型依赖市场趋势,逆势行情下表现可能受限。
---
六、批判性视角与细微差别
- 报告强调ACT机制提升网络表现,但也指出数据端改进后的效果不理想,突显当前深度学习技术在金融实际场景中仍存在瓶颈。
- 训练准确率与实际选股准确率之间显著差距,说明模型可能存在过拟合或样本外泛化能力不足,需要进一步完善训练和验证方法。
- 组合多头股票比例偏高,与市场上涨的相关性表明模型部分依赖于整体趋势,抗逆境能力仍需考量。
- 报告虽较为客观,但对ACT优势评价较明确,后续仍需实盘测试和更宽泛数据验证。
- 未详细披露算法的超参数敏感性分析、模型稳定性和风险应对措施,存在分析深度限制。
---
七、结论性综合
该报告系统深入研究了基于递归神经网络的多因子选股模型,重点引入自适应计算次数(ACT)机制以解决传统RNN在深度增加时梯度消失和训练效率低下的问题。报告通过论述RNN和LSTM的架构演变,详细解析了ACT结构的原理和实现步骤,利用丰富的实证数据(2007-2017年A股市场微观多因子样本)进行模型性能对比。
关键发现包括:
- ACT机制明显加快模型的训练收敛速度,降低迭代次数,提升学习效率(图10);
- ACT增强的RNN模型在多头、中性、空头组合收益表现上区分度显著优于LSTM,尤其多头组合收益绝对水平更高(图11);
- 选股准确率约15%,与训练准确率有较大差距,说明深度学习模型在多因子选股中的实际有效性仍有限(图12);
- 模型选出的看多比例偏高,与市场大盘涨跌趋势关系密切,反映模型实际操作中依赖整体市场行情(图13);
- 对输入数据结构的改良试验未取得显著突破,提示数据端优化对模型表现依然关键。
报告整体展示了ACT机制作为RNN深度学习在金融多因子选股领域中提升模型复杂性与表现的有效手段,但实际投资应用受到准确率限制和市场趋势依赖影响,仍有较大研究和改进空间。数据端的特征选择、标签设定和样本处理仍是未来模型优化的重点。报告强调需综合考量模型与数据两个方向的协同进步,才能实现更为稳定、有效的量化选股解决方案。
综上,国信证券的本次专题报告为投资者和量化研究人员提供了关于深度神经网络,尤其是在复杂度控制和计算深度自适应机制方面的前沿研究视角,展示了深度学习技术在中国A股市场多因子投资建模中的应用潜力和挑战,具备较高的学术与实务参考价值。
---
附:部分重点图表markdown形式展示
- 图1:递归神经网络及其展开形式

- 图2:LSTM的隐含层设计

- 图3:ACT-RNN结构

- 图10:训练准确率曲线

- 图11:ACT选股收益曲线

- 图12:看多组合TOP100准确率

- 图13:看多组合占比

---
引用说明:本分析报告内容均基于原文各页内容,页码标注详见每段引用。