基于多元分析的 CNN-LSTM 模型
创建于 更新于
摘要
本报告介绍了多元 CNN-LSTM 模型,结合卷积神经网络与长短期记忆网络优势,利用多变量时间序列分析,实现对上海、日本、新加坡及印尼四大亚洲股市指数的并行预测。实验结果表明,该模型较之单独 CNN 或 LSTM 模型,在新冠疫情期间对市场指数的预测精度最高,错误最小,且预测误差在训练和测试阶段表现稳定,有助于投资决策支持。[page::0][page::2][page::8][page::12][page::13]
速读内容
研究背景与理论基础 [page::2]
- 股票市场指数作为金融时间序列,其走势受到多因素影响且存在高噪声和波动聚集特性。
- 当前多模型集成及多元时间序列分析方法具备更高的预测潜力,单变量预测模型存在局限。
多元 CNN-LSTM 模型架构与流程 [page::6][page::7][page::8]

- 输入多维时间序列数据(上海、日本、新加坡、印尼股市指数),先经过一维卷积层提取特征,再通过池化层降维。
- 卷积层输出作为 LSTM 层的输入,执行时间序列模式学习及预测,最终通过全连接层输出预测结果。
- 训练采用反向传播,通过最小化均方根误差(RMSE)调整权重直至满足停止条件。
数据与实验设计 [page::7][page::8]
- 数据时间范围:2020年1月1日至2020年12月31日,共242个交易日,体现疫情高波动期特性。
- 数据标准化处理确保不同市场指数可比。
- 训练集:前170个交易日,测试集:后72个交易日。
预测效果对比与评价 [page::9][page::10][page::11][page::12]



- 三种模型(CNN、LSTM、多元 CNN-LSTM)均能较好拟合股市走势,多元 CNN-LSTM模型表现最佳,预测误差显著最低。
- 绿色区域误差面积最小,表明多元 CNN-LSTM 准确度最高且更稳定。
- 关键交易日(3月疫情爆发初期)误差最大,模型能迅速调整响应市场变化。
- RMSE指标显示多元 CNN-LSTM在训练和测试阶段均优于单独CNN和LSTM。
预测结果统计特性比对 [page::13]
| 描述统计 | 上海 (实际) | 上海 (预测) | 日本 (实际) | 日本 (预测) | 新加坡 (实际) | 新加坡 (预测) | 印尼 (实际) | 印尼 (预测) |
|------------------|------------|-------------|------------|-------------|--------------|--------------|------------|-------------|
| 均值 | 1.1917 | 1.1802 | 1.0997 | 1.0853 | 1.0260 | 1.0221 | 1.0315 | 1.0421 |
| 中位数 | 1.1872 | 1.1783 | 1.0956 | 1.0847 | 1.0336 | 1.0401 | 1.0093 | 1.0102 |
| 标准差 | 0.0320 | 0.0296 | 0.0677 | 0.0643 | 0.0277 | 0.0291 | 0.0787 | 0.0766 |
| 方差 | 0.0010 | 0.0012 | 0.0046 | 0.0043 | 0.0008 | 0.0071 | 0.0062 | 0.0058 |
| 峰度 | 0.3295 | 0.3187 | 1.7725 | 1.7523 | 0.8161 | 0.8021 | 1.3399 | 1.3187 |
| 偏度 | 0.3376 | 0.3152 | 0.1284 | 0.1179 | 1.1910 | 1.1876 | 0.3793 | 0.3685 |
| 极差 | 0.1497 | 0.1502 | 0.2022 | 0.2013 | 0.1132 | 0.1045 | 0.2520 | 0.2471 |
| 最小值 | 1.1288 | 1.1256 | 1.0121 | 1.0097 | 0.9570 | 0.9613 | 0.9226 | 0.9197 |
| 最大值 | 1.2786 | 1.2691 | 1.2143 | 1.2095 | 1.0702 | 1.0273 | 1.1746 | 1.1637 |
| 置信区间 (95%) | 0.0075 | 0.0086 | 0.0159 | 0.0137 | 0.0065 | 0.0061 | 0.0185 | 0.0157 |
- 预测数据与实际数据在统计特性上高度相似,模型保持了时间序列的基本性质。
结论与展望 [page::13][page::14]
- 多元 CNN-LSTM 模型能够有效捕捉平行金融时间序列之间的相互影响,提升预测准确度。
- 模型适用于多市场指数预测,为投资决策提供科学依据。
- 当前模型未包含外生变量(如舆论、政策),未来研究将拓展更多定量和定性因子,完善投资决策支持系统。
深度阅读
基于多元分析的 CNN-LSTM 模型研究报告详尽分析
---
一、元数据与概览
报告标题: 基于多元分析的 CNN-LSTM 模型——学界纵横系列之二十七
作者及机构: 陈奥林(分析师)、徐浩天(研究助理)等,国泰君安证券研究所金融工程团队
发布机构: 国泰君安证券研究所
联系方式及证书编号详见第一页
报告主题: 介绍并评价一种基于多变量深度学习的卷积神经网络(CNN)与长短期记忆网络(LSTM)集成的金融时间序列预测模型,聚焦于多并行金融时间序列数据的应用,特别是疫情期间亚洲股市指数的预测。
核心论点及结论:
- 随着深度学习技术在金融预测领域的广泛应用,CNN和LSTM各有优势但又各有不足。
- 通过集成CNN和LSTM形成多元CNN-LSTM模型,能兼顾两者优势,同时利用多个并行时间序列间的相互作用,提高金融时间序列预测的准确性。
- 以2020年新冠疫情大流行期间来自上海、日本、新加坡和印度尼西亚四个股市指数数据做测试,结果显示多元CNN-LSTM模型的预测精度优于单一CNN或LSTM模型,表现为最低的RMSE和整体较小的预测误差。
- 模型适用于多变量时间序列复杂相互影响的场景,对投资决策有实际辅助价值。
- 模型当前仍有缺陷,未考虑外部影响变量,未来可整合更多定性与定量因素以完善。(见摘要及结论部分)[page::0,2,13,14]
---
二、逐节深度解读
1. 文章背景与理论基础
1.1 文章背景
时间序列数据在金融领域尤为重要,股市指数是典型的金融时间序列。当前大部分预测模型偏重于单变量分析,忽视了全球化背景下不同市场间的交互影响。而金融时间序列的高噪声和波动聚集性质增加了预测难度。研究认为,融合多个模型的优势及多变量(多元)时间序列分析是提升预测准确性的关键突破口。
文中引用Harya Widiputra等人的论文作为理论依据,该研究开发了多元CNN-LSTM模型,集成CNN和LSTM的优点,同时考虑多个平行股票指数间的相互作用,旨在提高整体预测效果。[page::2]
1.2 理论基础
- CNN简介:生物学启发的神经网络,以卷积和池化层提取数据局部特征,最初用于图像处理,但近年来被证实适合多通道时间序列特征提取。其结构包括输入层、多个卷积核、池化层和全连接层(见图1)。
- CNN与LSTM在金融中的应用及不足:CNN侧重空间特征提取但对数值时间序列的动力学建模有限,LSTM擅长捕捉连续时序数据的动态变化但单独使用时可能提取重要特征能力不足。二者结合形成的多元集成模型能弥补各自短板,提升预测稳定性与准确度,并本报告中的预测任务强调多变量时间序列之间的相关性,体现多元分析的理论基础。(详见1.2节)[page::2,3,4,5]
2. 主要工作与核心模型
2.1 主要工作
基于提出的问题和理论,作者完成了关键工作:
- 开发出一个将CNN和LSTM集成,结合多元时间序列相互关系的多元CNN-LSTM模型。
- 采用来自四个亚洲股市的平行时间序列数据,集中在疫情高波动期检验模型的有效性。
- 通过与单独CNN和单独LSTM模型对比,实证了多元CNN-LSTM模型的优越预测表现和更强泛化能力。[page::5]
2.2 核心模型(多元CNN-LSTM)
2.2.1 多元时间序列分析模型
多元时间序列预测的数学表达考虑了多个序列间的历史值相互依赖关系,即预测变量不仅依赖自身历史,还受其他变量历史影响。此相互依赖的体现也服务于更准确深刻的市场联动理解,尤其适合全球金融市场联动性较强的环境。[page::6]
2.2.2 多元CNN-LSTM模型结构
- 数据格式:训练数据为三维张量形状(样本数,不定,4个时间步长,4个输入维度-分别是四个股市指数)。
- 此结构允许并行处理多条金融时间序列,同时学习序列间内生交互特征,增强模型理解市场动态的能力。[page::6,7,8]
2.2.3 训练与预测流程
简要流程包括:
- 初始化网络参数(权重、偏差)。
- 训练集输入模型,CNN层提取特征后进入LSTM层,后者完成时序信息的分析与预测,最终由全连接层输出预测值。
- 利用误差反向传播机制调整参数,训练迭代直至误差小于阈值或达到指定训练轮次。
- 使用测试集检验模型预测效果,采用均方根误差(RMSE)作为评价指标。
- RMSE计算公式为样本预测值与实际值误差平方的均值开根号,数值越小越精准。[page::7,8]
3. 实验设置与数据
- 选取时间段:2020年1月至12月(242个交易日),疫情导致高市场波动,适合模型能力检验。
- 训练测试划分:前170个交易日为训练集,后72个交易日为测试集。[page::7,8]
---
三、图表深度解读
图1:CNN基本结构(第3页)
展示了CNN的数据流程:输入→卷积层→池化层→全连接层→输出。说明了CNN模型提取特征的典型流程,支持多维数据处理,基础架构清晰。此图说明CNN适合处理多维时间序列特征,为之后多元CNN-LSTM结构打下理论基础。
图2:LSTM基本结构(第4页)
详细描绘LSTM内部的门控机制(遗忘门、输入门、输出门)及数据路径。公式结合图说明LSTM如何通过门控机制,控制信息的遗忘与记忆,克服梯度消失等传统RNN问题,对时序数据建模更有效。为后续模型训练理解核心模块打基础。
图3:多元CNN-LSTM整体结构(第6页)
高维矩阵数据输入→CNN层(卷积与池化)提取多维特征→LSTM捕捉时间依赖→全连接层输出。该图结合文字说明多序列并行输入数据及两种模型的集成,结构合理,技术实现点明确。
图4:本实验中多元CNN-LSTM模型结构(第8页)
显示模型做多维数据输入、64维卷积核、池化后的维度以及两个LSTM隐层的节点数为100的具体网络形态。对应第3-6页结构的具体实现,体现论文实践细节。数据维度清晰,有助于理解模型复杂性和计算需求。
图5 & 图6:训练与测试阶段预测值与实际值对比(第9-11页)
- 三套模型:CNN、LSTM、CNN-LSTM真实(solid)与预测(虚线)曲线对比。图中各市场指数分别用不同颜色标注。
- 黄色阴影区域为平均预测误差大小,越小越优。
- 训练阶段图5显示三个模型均能较好拟合实际曲线,但多元CNN-LSTM错误面积较小。
- 测试阶段图6同样演示多元CNN-LSTM误差最小,且在股市震荡较大的疫情初期(第55个交易日)误差出现峰值后迅速收敛,显示出了良好的适应市场突发事件能力。
- 总体呈现多元CNN-LSTM稳定优于单模型,尤其在多市场同时预测场景表现出整合优势。
图7 & 图8:训练阶段和测试阶段的RMSE比较柱状图(第12页)
- 分别显示四个市场在三个模型上的RMSE数值。
- 训练测试阶段均证明多元CNN-LSTM RMSE最低,显著优于单一CNN和LSTM。
- 具体数值如:训练阶段N225市场的CNN-LSTM RMSE仅0.0145,远低于CNN的0.0305,也低于LSTM的0.0274。
- 该统计直接验证了预测误差的定量优势,是模型性能最重要的量化指标。
表1:预测结果与真实值的描述性统计对比(第13页)
包括均值、中位数、标准差、偏度、峰度、极值等多指标比对:
- 指标间实际值与预测值非常接近,均值相差介于0.01以下,标准差、偏度峰度等统计量也近似,表明模型预测不仅强调点估计准确,更保持了数据生成过程的统计特性。
- 这验证了预测模型在保持整体数据分布的真实性方面表现良好,进一步增强模型在实际金融场景应用的可信度。
---
四、估值与模型性能分析
本报告侧重模型结构与预测性能,不涉及传统股票估值方法。但在模型性能方面,采用:
- 提供训练与测试数据的双向验证,确保模型泛化能力。
- 使用误差积累面积(黄色区域)直观表现预测误差趋势及突发事件响应能力。
- 训练采用反馈调整机制(反向传播),确保模型参数最优化。
- 双层LSTM双卷积设计结合多元时间序列特征,系统地提升模型学习能力。
模型实现采用具体三维张量结构输入,充分利用了多变量的时空特征,充分利用了CNN局部特征提取和LSTM时序依赖分析能力的互补优势,取得显著预测提升。
---
五、风险因素评估
报告未明确细致列出风险因素章节,但隐含与可推断风险包括:
- 数据依赖风险:模型性能依赖历史数据质量及合理性,疫情等极端事件下数据分布非稳态,预测可能受限。
- 模型训练与过拟合风险:深度学习模型训练复杂,可能存在过拟合风险,报告通过训练测试拆分缓解。
报告未明确缓解措施,风险提示较弱,未来需增加模型稳健性与解释性研究。
---
六、批判性视角与细微差别
- 报告详细介绍了模型架构、理论基础与实验设计,逻辑严密且实验数据符合实际金融场景。
- 系统比较单模型与集成模型效果,带有充分的数理统计与可视化数据支持。
- 模型设计实用且有一定创新,结合多元时间序列相互作用,对实际量化预测有借鉴价值。
- 文章依赖已有文献,未提及数据预处理细节(例如异常点处理、非线性转换等),可能影响结果泛化。
- 未对模型调参细节做充分披露,如卷积核大小、层数选择、训练轮次等,限制他人复现与检验。
- 缺乏多种评价指标(如MAE、MAPE等)以及不同市场环境下模型稳健性检验。
- 风险因素未系统展开,尤其对模型外延风险及非市场风险关注不足。
- 缺乏对模型计算复杂度及实时应用潜力的讨论。
- 对CNN-LSTM模型集成的具体优势机制仅做理论说明,缺乏深入的机制解析(如特征融合具体方式)。
- 实验时间截选集中在疫情年份,特殊经济环境可能限制结果的普适性。
- 标准差与方差数据中出现预期外的偏差,可能源于数据标准化处理方式和模型拟合误差需提醒注意。
- 报告最后提到未来将引入更多定量和定性变量,显示当前模型的限制性,亦体现科研方向的开放性和阶段性特征。[page::14,13,2,5]
---
七、结论性综合
本报告系统介绍并检验了基于多元时间序列分析理念,结合卷积神经网络与长短期记忆网络的集成模型——多元CNN-LSTM模型在金融时间序列,尤其是股票指数预测中的应用表现。与传统单一CNN和LSTM模型相比,该模型充分利用了多市场指数间的相互影响,结合CNN的特征提取优点和LSTM的时序记忆优势,强化了市场走势预测能力。
通过采用2020年疫情引发的市场高波动数据测试,模型展示了较低的预测误差RMSE,且在训练和测试过程中的误差面积及幅度均优于基线模型。图形结果清晰展示了模型对四个亚洲股市指数的良好拟合能力和误差响应速度。基于描述性统计的比较进一步证实了预测结果在均值、方差、偏度等统计特征上与真实市场数据的高度一致。
此模型为基于深度学习进行多元金融时间序列预测提供了合理可行的新方案,适合应用于多市场联动密切、对风险控制要求高的复杂金融环境,有助于支持投资决策。尽管模型未整合关键外生变量,并存在模型细节公开不足及风险提示不足的问题,仍代表了当前量化金融工程与人工智能技术融合创新的前沿。
展望未来,结合更多外部环境因素和投资策略构建综合投资系统将提升模型实际应用价值,推动金融时间序列预测和实践的深化发展。
---
附:关键图表索引
- 图2(第4页):LSTM详细结构及门控机制示意。
- 图4(第8页):实验用多元CNN-LSTM网络层次与数据维度展示。
- 图7-8(第12页):训练和测试阶段各模型RMSE柱状对比,定量表现模型优劣。
---
参考文献附注
所有引用均来自报告正文内容,页码依上述[page::]标注对应。