时序预测系列(一)基于分解算法和深度学习的预测建模研究
创建于 更新于
摘要
本报告结合经验模态分解算法(EMD和CEEMDAN)与深度学习模型(LSTM和GRU)对期货日度收盘价进行单步预测,提出通过IMF分量重组及高频去噪提升预测性能,实证表明重组去噪后模型在沪铜、股指与国债期货上均有效提升拟合优度和方向准确率,最高方向准确率超过60% [page::0][page::18][page::24]
速读内容
组合模型构建及模型训练流程 [page::13][page::14][page::16]

- 采用EMD和CEEMDAN分解原始序列为多个IMF分量和趋势项。
- 通过t检验选择IMF分量进行高频、低频和趋势的重组。
- 针对重组后的子序列使用深层LSTM和GRU网络训练预测。
- 深层网络包含两层LSTM/GRU及全连接层,采用Adam优化器和早停机制。
EMD与CEEMDAN算法分解效果及重组策略 [page::5][page::7][page::18][page::19]


- EMD分解分出较多高低频及趋势IMF分量,存在模态混叠问题。
- CEEMDAN分解结果相比EMD分量更少且差异更明显,分解结果更优。
- 通过IMF分量与趋势项组合重组形成高频、低频和趋势序列。
高频序列去噪优化方法及效果对比 [page::18][page::19]

| 序列名称 | R2 | RMSE | MAE | DA |
|-----------------------|---------|----------|----------|----------|
| 高频序列 | 88.66% | 1231.09 | 903.12 | 49.13% |
| 高频序列-IMF1 | 93.69% | 918.09 | 677.14 | 60.90% |
| 高频序列-IMF1-IMF2 | 93.92% | 901.17 | 651.89 | 61.94% |
| 高频序列-IMF1-IMF2-IMF3| 91.01% | 1096.39 | 801.53 | 57.79% |
- 去除高频IMF1和IMF2后模型拟合指标显著提升,方向准确率提升约12%;剔除IMF1和IMF2的组合优于单剔除IMF1 [page::19].
分解后重组预测模型效果展示 [page::20][page::21]


| 模型名称 | R2 | RMSE | MAE | DA |
|----------------|---------|----------|----------|----------|
| LSTM | 91.01% | 1467.27 | 1142.69 | 51.90% |
| GRU | 92.52% | 1339.08 | 1032.62 | 52.25% |
| EMDLSTM1 | 92.41% | 1348.70 | 957.24 | 50.87% |
| EMDLSTM2 | 95.31% | 1059.43 | 779.43 | 55.71% |
| EMDGRU1 | 93.00% | 1294.65 | 949.29 | 52.60% |
| EMDGRU2 | 95.54% | 1033.25 | 747.80 | 63.32% |
| CEEMDANLSTM1 | 94.07% | 1191.98 | 912.06 | 51.56% |
| CEEMDANLSTM2 | 95.71% | 1013.82 | 805.46 | 59.17% |
| CEEMDANGRU1 | 94.06% | 1193.39 | 937.84 | 54.33% |
| CEEMDANGRU2 | 95.41% | 1049.14 | 838.76 | 54.67% |
- 重组去噪后深度学习模型预测效果明显优于单一深度学习模型,$R^{2}$提高约4%,CEEMDANLSTM2拟合效果最佳,GRU版EMD去噪模型方向准确率最高 [page::21].
泛化验证:IF与T期货模型预测效果 [page::22][page::23]


| 模型名称 | R2 (IF) | DA (IF) | R2 (T) | DA (T) |
|----------------|---------|---------|--------|--------|
| EMDGRU2 | 98.43% | 63.32% | 92.52% | 65.78% |
| CEEMDAN_GRU2 | 97.54% | 64.36% | 92.63% | 66.31% |
- IF和T期货预测结果再次验证了重组去噪组合模型的优越性,方向准确率皆超过60% [page::22][page::23].
量化因子/策略总结:基于分解算法和深度学习的时序预测组合建模 [page::0][page::24]
- 结合EMD和CEEMDAN的IMF分量提取与重组去噪策略,有效剔除高频噪声,提升LSTM与GRU的预测能力。
- 训练过程采用两层深度网络结构,结合Dropout防止过拟合。
- 模型在沪铜、沪深300股指期货及十年期国债期货均表现出优异的拟合优度和方向预测准确率。
- CEEMDAN和EMD各有优势,GRU和LSTM预测效果相近,模型优化无绝对优先选项。 [page::24]
深度阅读
对报告《时序预测系列(一)基于分解算法和深度学习的预测建模研究》的详尽分析报告
---
一、元数据与概览 (引言与报告概览)
- 报告标题:时序预测系列(一)基于分解算法和深度学习的预测建模研究
- 作者及机构:
- 研究员:蒋可欣(中信期货研究所,FRM持证)
- 发布机构:中信期货有限公司商品量化组
- 发布日期:文中无明确显示,推断为2022-2023年间(基于数据时间范围)
- 主题:对期货日度收盘价进行时序预测,聚焦于信号分解算法(EMD与CEEMDAN)与深度学习算法(LSTM和GRU)的结合建模
- 核心论点:
- 利用EMD及其改进算法CEEMDAN将时序信号分解为固有模态函数 (IMF) 后,结合LSTM和GRU对分解后的子序列单独建模,整体提高预测精度及方向正确率。
- 高频子序列去噪(剔除噪声显著的IMF分量)金额进一步提升预测效果。
- CEEMDAN 不一定优于EMD,GRU也不一定优于LSTM,算法效果需针对具体信号调试。
- 风险提示:本报告中算法及模型应用为回溯研究案例,不构成投资建议[page::0]
---
二、逐节深度解读
1. 引言(页3)
- 中国金融市场具有非线性、非平稳、高噪音等复杂特性,传统技术分析简单但延迟大及不确定性高,统计模型对线性序列有效但对非线性不适用,深度学习能提取复杂序列的长期依赖且灵活度高。
- 传统神经网络泛化能力弱,深度学习(如RNN、CNN)提供强特征抽取,然而金融市场信号随机性强,单一方法建模效果有限。
- 本文提出信号分解+深度学习的组合预测模型,是希望融合信号处理优势和深度学习的表达能力,解决复杂多维时序预测。
- 研究对象包括期货及股票市场,具备较好泛用性[page::3]
2. EMD与CEEMDAN基本原理(页4-7)
- EMD:
- 自适应时频信号分解,分解出互相正交的IMF分量和趋势项,适用非线性、非平稳信号。
- 计算依赖局部极值点和上下包络线,反复求取瞬时平均直至满足IMF条件。
- 优点:不需基函数,适合复杂时序;缺点:存在模态混叠问题,即信号特征在多个IMF中混杂。
- 通过示例(CU主力合约价格,2011-2022)直观展示7个IMF分量加1趋势项分解结果。
- EEMD与CEEMDAN优化:
- 加噪音平均技术(EEMD)用噪音平滑异常事件,减轻模态混叠。
- CEEMDAN改进EEMD,逐层加噪并求均值,减少噪音传递和计算量,分解更优。
- 示例显示CEEMDAN分解成5个IMF+趋势项,成分更少更区别明显,效果最好。
- 图表1-3清晰展示分解效果[page::4,5,6,7]
3. LSTM与GRU网络原理(页7-13)
- RNN回顾:
- 传统循环神经网络因梯度消失而记忆有限,难以捕捉长期依赖。
- 如图表4所示,基本展开结构。
- LSTM结构:
- 增加细胞状态 $Ct$ 和3个门(遗忘门$ft$,输入门$it$,输出门$ot$),控制信息遗忘与更新。
- 遗忘门用sigmoid映射决定保留多少旧信息;输入门决定新信息采纳;输出门决定输出内容。
- 激活函数sigmoid和tanh特性分别用作逻辑门(0~1概率性质)和值域归一化方便梯度传递。
- 复杂门控支持长期序列动态学习,缺点是结构复杂,计算成本高。
- GRU结构:
- GRU合并了部分LSTM门控(遗忘、输入、输出门合并为更新门$zt$和重置门$rt$)。
- 状态和输出合并为单一隐藏状态$ht$,结构更简洁、训练更快。
- 如图表8说明,公式清晰描述门控逻辑。
- 综述LSTM和GRU各自优势,研究者对比其预测性能[page::7~13]
4. 组合模型构建(页13-16)
- IMF重组:
- 将分解所得IMF分量根据均值用t检验区分“显著不为0”的变化。
- 基于检验结果按序依次累加构成高频和低频序列,并保留残余趋势项。
- 目的是简化模型结构,减少建模复杂度。
- 建模流程:
- 原始序列分解(EMD/CEEMDAN)
- IMF及趋势项重组为 高频/低频/趋势三序列
- 分别用LSTM及GRU对三序列单独训练预测
- 将各分量预测值求和作为最终预测输出
- 图表9清晰表示流程
- LSTM/GRU网络结构及训练策略:
- 构建两层LSTM/GRU及两层全连接层的深度网络,隐藏单元数(8,8),batch-size=64,训练迭代100次。
- 加入Dropout(失活率0.2)防止过拟合。
- 采用Mini-Batch,损失函数用MSE,优化器Adam,早停5次不降停止。
- 采用基于Python及PyTorch框架实现,时间窗口长度30,单步预测下一时点。
- 图表10展示网络结构[page::13~16]
5. 预测结果分析(页17-23)
- 数据概况:
- 选用沪铜(CU)、沪深300股指(IF)、十年期国债(T)主力合约收盘价,时间跨度涵盖2011至2022年。
- 训练/验证/测试集比例0.8:0.1:0.1。
- 对序列做Z-score标准化,缓解量纲影响。
- 预测性能指标:
- $R^{2}$:拟合优度,越接近1越好。
- RMSE、MAE:均方根和绝对误差,数值越小越好。
- DA(方向准确率):预测涨跌方向的一致性,越高越好。
- CU期货分解预测实验:
- 对EMD及CEEMDAN分解后的高低频及趋势项分别建模。
- 高频序列噪声大,趋势项单独预测效果差,尝试通过重新重组和剔除噪声IMF分量优化预测性能。
- EMD结果(图表11):
- 高频序列$R^{2}$约89%,趋势项负值表示预测能力极弱,低频序列与趋势项合并后有较好效果($R^{2}$ 98.63%)。
- 高频序列剔除IMF1和IMF2后,$R^{2}$提升至93%以上,方向准确率由49%提升至62%左右。
- 选择剔除IMF1和IMF2进行噪声去除。
- CEEMDAN结果(图表14、15):
- 趋势项本身预测极差,但将趋势项与IMF7、IMF6、IMF5组合后效果大大提升($R^{2}$达到95.68%),剩余的IMF低频率分量合成新高频序列。
- 高频序列去噪效果明显,剔除IMF3和IMF4提升预测性能,$R^{2}$从44.91%提升到将近78%。
- 不同模型对比(图表16、17):
- 重组去噪后的模型整体优于单一深度学习模型。
- 预测指标最优为CEEMDANLSTM2($R^{2}$=95.71%,DA=59.17%)
- EMDGRU2方向准确率最高(63.32%),$R^{2}$略低于CEEMDANLSTM2。
- IF、T期货预测验证(图表18-21):
- 同样模型架构验证泛化能力,均体现了分解去噪组合模型的预测优势。
- IF期货中EMDGRU2和CEEMDANGRU2表现最好,$R^{2}$分别近98.4%和97.5%,DA约63%-64%。
- T期货预测类似,均$R^{2}$约92.5%,DA均超65%。
- 结论:
- 分解算法有效提升LSTM、GRU网络的拟合和方向正确率,降低噪声干扰及预测滞后。
- GRU与LSTM表现相近,GRU稍优;CEEMDAN与EMD对深度模型优化能力因模型而异,没有绝对优势。
- 重组和去噪策略对综合效果显著[page::17~23]
6. 结论与展望(页24)
- 主要结论:
1. IMF分量与趋势项单独重组组合构建子序列,因LSTM和GRU对纯趋势项学习弱,需重新搭配组合。
2. 高频IMF分量噪声多,剔除部分噪声分量有助模型效果。
3. EMD和CEEMDAN均优化深度学习预测。
4. GRU预测效果不必然优于LSTM。
5. EMD和CEEMDAN对模型优化强弱不确定。
- 研究后续可扩展到其他神经网络结构和参数调优。
- 本报告作为系列第一篇,后续将深入介绍更多深度学习模型[page::24]
---
三、图表深度解读
图表1(EMD分解过程,页5)
- 显示CU主力合约价格及其被分解成7个IMF分量和一个趋势项。
- IMF1为最高频分量,波动幅度最大,逐层IMF频率降低,趋势项近似单调函数,反映价格长期趋势。
- 说明EMD能自适应解析复杂非线性时序结构,使后续模型分层训练。
- 该图配合文中详细算法讲解直观展示过程[page::5]
图表2(CEEMDAN迭代流程,页6)
- 流程图解CEEMDAN相较EMD的加噪迭代策略,每求得一个IMF后对残余信号再加噪求解。
- 减少噪声级联影响,有效提升分解精度。
- 直观展现算法思想,辅助理解CEEMDAN优越性[page::6]
图表3(CEEMDAN分解过程,页7)
- 类似图1,CU主力合约被分解为5个IMF及趋势项。
- IMF数目减少,且频率成分区分更明显,反噪效果好。
- 说明CEEMDAN生成更加简洁有效的分量,有助后续建模[page::7]
图表4-8(RNN、LSTM、GRU神经元结构,页8-12)
- 图4展示单个RNN结构及时间展开链式图,说明基础记忆机理。
- 图5是LSTM细胞结构,突出遗忘门、输入门、输出门工作路径。
- 图6-7分别为sigmoid和tanh激活函数曲线,阐释门控机制使用的数学基础。
- 图8是GRU结构,展示其简化的两个门设计。
- 这些图表均辅助对复杂门控网络的运作机制理解,基础理论支持[page::8~12]
图表9(组合模型流程,页14)
- 流程图清晰展示:原始序列→EMD/CEEMDAN分解→IMF重组→LSTM/GRU训练→预测→结果集成。
- 骨架结构说明实现方法与建模路径,易于读者理解整体框架[page::14]
图表10(LSTM/GRU网络计算图,页16)
- 深层网络结构含两层循环网络和全连接层,中间有Dropout,表示训练时随机失活防止过拟合。
- 输入层特征经过深度抽取,输出预测结果。
- 细节揭示训练参数设置与架构优化策略[page::16]
图表11-21(CU、IF、T预测结果及比较,页17-23)
- 表格详细列出不同频率序列及不同重组策略下的预测指标,突出分解和去噪效果。
- 多图(如图12,15,20,21)用折线对比真实值与预测值,说明模型拟合的准确性和趋势捕捉能力。
- 例如图12中剔除IMF1和IMF2后预测曲线更接近真实高频序列波动。
- 图17、19、21综合表对比原始LSTM/GRU、EMD+LSTM/GRU、CEEMDAN+LSTM/GRU模型指标,验证组合模型的显著性能提升和泛化能力。
- 从这些多维数据和图像看,IMF重组与去噪是提升深度学习预测能力的重要方向。
- 不同期货品种测试,说明方法的适用性和稳健性[page::17~23]
---
四、估值分析
- 本报告为方法论和模型性能研究报告,未涉及传统金融资产估值分析,故无相关内容。
---
五、风险因素评估
- 免责声明部分提及:
- 报告所用模型基于历史回测示例,非投资建议,存在模型过拟合、泛化能力不足等风险。
- 金融市场受多因素影响,模型不可确保未来收益。
- 算法优化效果不保证绝对优越,具体参数、分解次数、窗口大小等模型设计需根据实际调整。
- 报告未对模型风险做量化敲定,但通过多品种验证体现其普适性,有一定风险缓解。
- 读者应独立判断并谨慎使用[page::0,26]
---
六、批判性视角与细微差别
- 报告强调CEEMDAN不一定优于EMD且GRU不一定优于LSTM,体现了研究的客观性和多样性验证,避免偏颇。
- 然而,报告组合策略选择基于经验和t检验,欠缺深入理论统一指导,分解后重组的最佳方案依赖后验测试,存在一定数据驱动优化的成分,可能带来部分向历史拟合倾向。
- 报告未详细讨论模型对极端行情的预判能力和异常事件处理,金融市场尾部风险未充分反映。
- 训练的超参数固定,未深入参数敏感性分析,后续报告提及将拓展该部分,提升模型体系的科学合理性。
- 图表和指标虽覆盖了方向准确与误差指标,但缺少时间序列预测常用的其他评价指标解释,如偏差趋势、残差自相关等可为后续完善。
- 未来系列如能扩展不同深度学习架构(Transformer、Attention机制等)或结合基本面因子,将更完备[page::24]
---
七、结论性综合
这份以《时序预测系列(一)基于分解算法和深度学习的预测建模研究》为题的报告,系统阐述并验证了将信号分解算法(EMD和CEEMDAN)与深度学习序列模型(LSTM和GRU)融合应用于期货市场日频收盘价预测的研究成果。
报告明确指出,非线性、非平稳的金融时间序列可借助EMD与CEEMDAN将复杂波动拆解为一系列固有模态函数和趋势成分。单独利用深度神经网络对这些子序列分别训练,能有效提炼信息,不仅提升拟合优度($R^2$),更重要的是提升了方向正确率(DA),这是交易策略的关键指标。具体实施中,通过统计显著性检验对IMF分量进行重组,聚合为高频、低频及趋势三类序列,有助于简化建模,并获得更好的学习效果。针对高频子序列常含噪声的事实,采用剔除高频IMF分量的去噪手段大幅提高了模型性能。
实验中,报告分别利用沪铜、沪深300股指和十年期国债期货历史数据,系统评测了EMD与CEEMDAN结合LSTM与GRU的组合模型的表现。结果表明,所有分解加重组及去噪的模型均明显优于单纯深度学习模型,从$R^2$提升约4个百分点,方向准确率超过60%。不同算法间无绝对优势,CEEMDAN对LSTM的优化稍好,GRU则在方向准确率方面稍胜;EMD结合GRU在实际应用同样表现出色。跨品种测试验证了模型泛化能力。
图表层面,EMD和CEEMDAN的分解效果、神经网络的结构细节及训练设置、各类子序列的预测表现均图文并茂,实用且完整。预测结果以丰富统计指标加深了对模型优劣及数据特征的理解。
总结来看,本报告较好地诠释了信号分解辅助深度学习在金融时序预测中的优势及应用细节,其研究框架适用于多种金融资产时序,策略精妙而务实。报告末段承认模型参数和网络结构仍有可调整空间,预留了后续发展方向。
该报告有以下重要启示:
- 非线性信号的分解处理是深度时序预测不可或缺的预处理步骤。
- 高频噪声抑制通过剔除部分IMF显著提升模型准确性。
- LSTM和GRU各有优势,具体选取依数据特性定制。
- CEEMDAN分解更为高效稳定,但并非对所有模型均有绝对提升。
- 泛化能力测试强化了模型的适用性说明。
报告为金融时序预测领域结合信号处理与深度学习方法提出了系统性的解决方案,兼顾理论与实操力度,具有较强的统计和金融实践价值。基于报告提供的详实理论框架和丰富实证结果,可为量化投资策略研发提供坚实数据与模型支持。
---
总结
本报告通过详尽剖析非线性时序分解算法EMD与CEEMDAN、结合深度循环神经网络LSTM与GRU,在期货收盘价单步预测领域的应用,实现了有效提升预测能力和方向把控能力的重大突破。通过合理的IMF分量重组与高频序列去噪,显著提高了模型稳定性和拟合度,且在多个品种数据集上验证了该方法的泛化适用性。这充分说明信号预处理与深度学习的有效融合是量化时序分析的未来趋势。结合对复杂金融市场时序信号的本质分析,本报告为金融数据科学领域提供了富有参考价值的创新研究范式和实践路径,有助于推动金融量化模型的精准化与智能化升级。
---
以上分析基于报告全文内容及所有图表的详细阅读和解读,引用页码均已注明,确保内容的溯源和可靠性。[page::0,1,3-26]