Neuroevolution Neural Architecture Search for Evolving RNNs in Stock Return Prediction and Portfolio Trading
创建于 更新于
摘要
本报告提出利用EXAMM神经进化算法针对30家道琼斯工业公司单独演化递归神经网络(RNN),以预测股票收益并结合简单多空策略,实现2022年熊市及2023年牛市期间的投资组合交易回报超越大盘表现,表明该方法有效提升时间序列财务预测和投资决策能力[page::0][page::5][page::6]。
速读内容
- 使用EXAMM算法演化针对每支股票的RNN模型,利用11种变异和2种交叉方法进化网络结构,继承父代权重以减少训练时间,增强模型对各股票特性的适应性[page::0][page::1].
- 投资组合包含2024年2月变动前的30家道琼斯工业平均成分股,所有股票均分配等权重,结合7个关键经济指标进行输入预测变量构建,包括日收益率、成交量变化、买卖价差等[page::2].
- 主要交易策略包括:
- 长仓策略:只买入预测收益为正的股票并持有至预测为负,简单且风险暴露较大。
- 日内多空策略:根据预测收益排序选定多头和空头股票,平衡风险并增强市场下跌时表现,允许使用50%的资本进行空头卖出[page::2][page::3].
- 实验采用1992年起的CRSP数据集构建训练数据,利用2021年及2022年分别作为验证集,测试集为2022年与2023年全年数据,覆盖牛熊市环境[page::3].
- Portfolio回测结果摘要:
- 长仓策略在2022年熊市获得39.52%(无手续费)回报,手续费考虑后影响甚微,2023年则负收益体现熊市风险[page::4].
- EXAMM演化RNN预测结果在2023年牛市表现优异,实现39.05%回报,超越同期DJI(13.7%)及S&P500(26.29%)指数,且优于LSTM、GRU等传统模型[page::4].
- 多空交易策略通过合理多空头仓位配置有效控制风险并提升收益,2022年实现整体正收益,2023年部分策略表现甚至超过S&P500指数[page::5].

- 量化因子与策略构建:
- 通过EXAMM算法自动设计优化RNN结构,避免手动调参,显著降低人力成本并具备扩展能力至更大规模股票组合[page::6].
- 简单多空策略结合预测结果,使用每日收盘收益排序实现选股,实测年化收益和夏普比率未明确给出,但表现显著优越于市场基准,尤其在动态调整多空仓位上效果突出[page::5][page::6].
- 研究指出股票市场受多种外部因素影响,未来可整合更多宏观和情绪数据,采用在线学习和强化学习进一步提升预测精度和交易策略效果[page::6].
深度阅读
金融研究报告深度分析:Neuroevolution Neural Architecture Search for Evolving RNNs in Stock Return Prediction and Portfolio Trading
---
1. 元数据与概览
- 报告标题:Neuroevolution Neural Architecture Search for Evolving RNNs in Stock Return Prediction and Portfolio Trading
- 作者:Zimeng Lyu, Amulya Saxena, Rohaan Nadeem, Hao Zhang, Travis Desell
- 单位:Rochester Institute of Technology, Rochester, USA
- 发布日期:2024年(未具体注明月份)
- 主题:本报告聚焦使用神经进化(Neuroevolution)方法中的神经架构搜索(Neural Architecture Search, NAS)算法——EXAMM,进化循环神经网络(Recurrent Neural Networks, RNNs)来预测个股收益率,并将预测结果应用于投资组合交易策略中,验证该方法在实现股票投资组合收益最大化上的效果。
核心论点:
报告提出利用EXAMM算法针对道琼斯工业指数(Dow-Jones Index, DJI)30家上市公司独立演化RNN模型,以预测每日股票收益率。基于预测的收益率,设计简单的投资组合交易策略(如长仓和多空策略)来买卖股票。实验证明,该方法生成的投资组合收益在2022年及2023年分别代表的熊市和牛市环境下,均优于市场基准指数(DJI和S&P 500)表现,展示出预报模型和交易策略的有效性。[page::0][page::1][page::5][page::6]
---
2. 逐节深度解读
2.1 引言(Introduction)
- 关键论点:
- 股票回报率的时间序列预测相较股价本身更为稳健,因其统计特性(均值、方差、自相关)较为平稳,更适合用统计与机器学习模型处理。
- 投资者更关注股票收益率而非绝对股价,因为收益率直接关乎资产组合表现和风险管理。
- 股票收益率预测是多种金融应用的基石,如资产配置、风险管理(VaR和CVaR)、算法交易、公司金融决策等。
- 投资组合算法交易通常包括两个部分:基于数据的预测模型和基于预测结果的交易策略。两者紧密相连,预测准确度直接影响交易收益。
- 使用神经进化算法逐步进化针对每只股票定制的高性能RNN,为组合交易决策提供精确回报预测是本研究的核心思路之一。[page::0][page::1]
- 推理依据:统计特性稳定使得机器学习模型可以泛化,且收益率相对股价是更具金融意义的指标,结合预测模型与交易策略两部分提升整体投资收益。
---
2.2 相关工作(Related Work)
- 总结了股票预测领域常用方法,从传统统计模型(ARIMA、ARCH)到先进机器学习和深度学习模型,强调深度循环神经网络(如LSTM、GRU等)近年来对捕捉非线性时序特征更有效。
- 介绍遗传算法和神经进化在优化金融预测模型超参数和特征选择方面的研究,指出这些方法能自动设计和调优模型,减少手动设计难度。
- 介绍金融决策领域神经进化的应用,如组合投资和交易策略的研究,及其实现的具体算法案例,突出本研究利用EXAMM算法进化RNN的独特之处。[page::1]
---
2.3 方法(Method)
2.3.1 EXAMM算法
- 采用Evolutionary eXploration of Augmenting Memory Models (EXAMM)算法作为神经进化工具,基于遗传算法原理,应用节点和边的突变及交叉操作,逐步构建复杂的RNN结构。
- 其核心优势在于:
- 种群分布在多个“岛”(islands)以维护基因多样性并实现信息交流。
- 权重继承减少训练轮次,加快模型收敛。
- 支持多种突变和交叉类型,可灵活演进适应各股票特性。
- 专门设计的记忆结构和权重传递令EXAMM特别适合时间序列预测任务。
- 这使其成为自动设计、优化针对每支股票的一流预测模型的有效工具。[page::1]
2.3.2 投资组合交易策略
- 长仓策略(Long-Only Strategy):仅做多,买入预测回报为正的股票,持有至预测转负卖出。简单等权分配资金。优点是策略简单,但完全暴露于市场风险,牛市中表现良好,熊市中可能亏损。
- 日内多空策略(Daily Long-Short Strategy):在每天开始时根据预测排序,买入回报预测较高的若干股票,同时做空预测回报较低的若干股票,实现市场中性或对冲风险,能在牛熊市均有表现。通常资金分配总投资组合的50%做多、50%做空。
- 两个策略的核心都是利用预测的回报率做买卖决策,但多空策略显著增加了风险管理能力,使收益更稳健。[page::1][page::2]
---
2.4 数据集(Dataset)
- 使用CRSP数据库中覆盖了美股主流交易所的高质量股票价格及指标数据,数据时间跨度长且包含丰富变量。
- 组合由2024年2月变动前的30只道琼斯工业指数成分股构成,每股等权重。选股涵盖多行业,流动性高。
- 采用了7个经济预测变量:股票日收益率、交易量变动比、买卖价差、非流动性指标、换手率、以及作为市场指标的DJI和S&P 500收益率。这些变量被用作模型输入,有助捕捉个股与市场环境的动态关系。
- 制备了两个数据集:分别以2022年和2023年为测试期,之前年份用作训练和验证,数据点长度约为全年交易日数(约250天)。
- 市场环境描述:2022年为熊市,DJI指数回报约-8.78%;2023年为牛市,回报约13.7%。该不同市场环境为模型性能提供了极为重要的现实检验场景。[page::2][page::3]
---
2.5 实验结果(Results)
2.5.1 交易成本影响(Transaction Costs)
- 通过两种方式(买卖价差代理及买卖价分别取Ask和Bid价)考察交易成本对长期回报的影响,发现因道琼斯成分股流动性高,成本较小,对最终投资组合回报影响有限,后续实验未纳入交易成本。[page::4]
2.5.2 返回预测表现(Return Prediction Performance)
- 长仓策略下,不同预测模型组合在2022和2023年展示了差异化表现(见表3):
- 2022年熊市,所有模型表现均负回报,但GRU略优于EXAMM;
- 2023年牛市,EXAMM生成的RNN组合相较其他模型如LSTM、MGU、GRU等回报显著较高,且超过DJI和S&P 500指数。
- 对比长期持有策略(buy & hold)和市场指数表现显示,EXAMM模型结合交易策略能带来更优的收益。[page::4][page::5]
2.5.3 多空投资组合策略表现(Portfolio Long-Short Strategy)
- 多空策略结果(表5与表6)揭示在2022年(熊市)和2023年(牛市)期间,不同组合的多空仓位分配能够有效缓解市场风险,并实现超市场的收益。
- 2022年熊市环境中,通过做空获得的回报帮助组合体现出优秀的逆市能力,多个多空仓位组合收益明显高于市场指数。
- 2023年牛市,多空策略下分配10%至1/3组合参与多空交易的方式达成最佳回报,部分组合超越了S&P 500的26.29%收益。
- 该部分凸显预测模型在辅助复杂交易策略中对利润提升的关键作用。[page::5]
---
3. 图表深度解读
表1:经济预测因子
| 预测因子 | 描述 |
|--------------|--------------------------|
| Return | 日收益率(百分比价格变化率) |
| Volume Change| 交易量日变化百分比 |
| Bid-Ask Spread| (AskPrice - BidPrice) / Price |
| Illiquidity | Return / (Volume × Price) |
| Turn Over | Volume / Shares Outstanding|
| DJI Return | 道琼斯工业指数收益率 |
| S&P500 Return| 标普500指数收益率 |
- 指标涵盖微观个股表现(收益率、交易量等)与宏观市场表现(指数收益率),为模型提供全面特征,对捕捉股价动态尤为重要。[page::2]
表2:长仓策略下的组合回报及交易成本影响(单位:%)
| 年份 | RET(无交易成本) | RET w/ TC1 | RET w/ TC2 |
|------|-----------------|------------|------------|
| 2022 | 39.52 | 38.78 | 38.94 |
| 2023 | -9.44 | -9.62 | -9.42 |
- 说明了基于不同的交易成本计算方式对组合回报的影响,结果表明对道琼斯成份股而言,交易成本对收益影响甚微,证明组合交易对成本的鲁棒性。[page::4]
表3:不同预测模型长仓策略回报比较(单位:%)
| 模型 | 2022 | 2023 |
|------|------|--------|
| EXAMM| -9.44| 39.05 |
| LSTM | -11.00 | 8.10 |
| MGU | -16.01| 16.82 |
| GRU | -8.38 | 14.94 |
| AR | -16.16| 12.66 |
| ARIMA| -21.24| 22.42 |
| SVR | -25.18| 12.74 |
| RF | -18.01| 15.01 |
- 2022年熊市期间表现均为负收益,但GRU和EXAMM稍优。2023牛市期间,EXAMM模型显著优于其它所有模型,甚至超越市场指数,显示出进化神经网络模型的优势。[page::4][page::5]
表4:买入持有基准及市场指数回报(%)
| 年份 | Buy & Hold | DJI Index | S&P 500 |
|------|------------|-----------|-----------|
| 2022 | -1.60 | -8.78 | -18.11 |
| 2023 | 3.23 | 13.70 | 26.29 |
- 买入持有策略与指数对比显示组合等权分配相较于价格加权的DJI指数表现差异显著。买入持有在牛市表现平平,而模型驱动的交易策略能创造更优收益。[page::4]
表5与表6:2022年与2023年日内多空组合策略收益矩阵
- 这两个矩阵表示不同“longx”股票组合与不同“shorty”股票组合的组合回报百分比,衡量多空组合在不同头寸配比下的表现。
- 2022年多数策略仍为负,但有多种组合明显优于市场指数,说明做空能力有效抵御熊市风险。
- 2023年多数组合均为正且部分超过26.29%绿标标识的S&P 500指数收益,表明多空策略对牛市获益也有积极促进作用。
- 该详细矩阵分析体现了多头和空头数量调整对于最终回报的重大影响,[page::5]
---
4. 估值分析
本报告重点关注股票回报预测和组合交易策略的性能,并未涉及典型的估值模型(如DCF、市盈率等)的分析。研究着眼于收益率预测精度及其驱动的投资组合净收益,而非个股或组合公允价值的估算。
---
5. 风险因素评估
- 熊市形势下,长仓策略固有市场风险暴露,单纯做多可能导致亏损,表现为2022年整体负收益。
- 多空策略虽减轻部分风险,但市场异常波动、模型预测失误仍存在影响组合回报的可能。
- 研发模型基于历史时序数据,未纳入宏观经济大事件、政治风险、或其他外部信息,限制预测准确度。
- 模型训练采用了多年历史数据,但预测周期长达一年,可能忽略更短期非平稳的市场动态,降低现实应用灵活性。
- 报告也指出,基于时间序列单一信息的预测能力有限,建议未来结合宏观经济指标、财报数据和消费者情绪等多元信息以提高预测质量。
- 未明确披露交易成本虽影响较小,但未来在资产流动性更弱或手续费更高环境下,交易成本风险仍需重视。[page::4][page::6]
---
6. 审慎视角与细微差别
- 虽然EXAMM模型在牛市表现卓越,但熊市中长仓策略表现不及GRU,这提示进化模型或许存在过拟合或模型未完全捕获极端行情的风险。
- 报告提倡用简单均权组合,未考虑市值加权或行业权重等因素,这可能影响实际应用的代表性和可扩展性。
- 仅用30只高流动性股票作为实验组合,样本规模相较于千余只股票的大型指数有限,限制了结果的普适性。
- 公认的多空策略资金分配为50%对50%,但实验多空组合的仓位调整缺乏对冲比例的严格讲解,细节部分未展现参数选择的理论依据。
- 交易策略极为简单,未结合更复杂的风险控制手段(如止损、动态调仓等),降低了策略的实用完整性。
- 虽然EXAMM减少手工调参工时,权重继承带来训练效率,但报告未详述其对模型泛化能力的影响。
- 文中多处仅提及“交易成本影响有限”,但未用更细微的分市场或新兴市场评估,存在局限。
- 总体保持客观,未刻意夸大模型效果,但需注意该研究在学术验证场景中完成,实际交易中仍需谨慎评估。[page::4][page::6]
---
7. 结论性综合
本报告提出并验证了利用神经进化算法EXAMM来自动演化针对每只股票的RNN模型,用于预测股票日收益率,并通过两种主流的投资组合交易策略(长仓和长短仓)验证了预测在真实投资决策中的效用。
研发的模型在牛市环境(2023年)表现尤为优越,不仅超过了标普500及道琼斯指数的市场水平,也优于传统RNN模型和其他机器学习方法,体现了神经进化模型结构搜索和权重继承的协同优势。
在2022年熊市,尽管长仓策略难以避免亏损,但多空策略借助做空能力依然能实现跑赢市场的策略回报,充分展示了预测与策略结合的实用价值。
多个表格(如表3、4、5、6)都明确支持了报告的中心论点:EXAMM演化RNN产生的回报预测效果领先,且结合策略在不同市场环境中的可操作性强,高流动性股票组合也足以获得明显超额收益。
此外,实验采用了行业标杆数据(CRSP),模型独立于手工设计,能灵活扩展至更大规模组合。
报告指明未来方向包括结合多元信息,采用更复杂交易策略,提升模型更新频率,以及扩展到更大规模股票池等。
综上,该研究为利用神经进化方法自动构建资产回报预测模型提供了突破,同时验证了其在正确策略下实现超额收益的能力,对金融机器学习理论和实践均具启发价值。[page::0][page::1][page::4][page::5][page::6]
---
参考图表展示(部分示例)
表3:不同预测模型长仓策略回报比较(%)
| 模型 | 2022 | 2023 |
|------|------|--------|
| EXAMM| -9.44| 39.05 |
| LSTM | -11.00 | 8.10 |
| MGU | -16.01| 16.82 |
| GRU | -8.38 | 14.94 |
(注:实际图片资源目录及名称暂无明示,以上为示意格式)
---
总结
本报告围绕EXAMM神经进化算法对循环神经网络自动架构搜索的应用进行了系统性的探索与验证,证明其在股票收益率预测及基于预测的投资组合管理中的有效性,尤其是在牛市实现了显著超额收益。通过严谨的实验设计、对比分析及多维数据验证,体现了神经进化算法在解决时间序列金融预测中独特且具优势的角色。该方法减少了人工调参需求,提升了模型的个股适应能力,拓展了基于机器学习的金融智能决策的边界,同时也指出了仍可提升的方向与风险考量。报告整体结构条理清晰、数据充分、论证严密,是金融机器学习领域一项富有启发的工作。