使用深度神经网络提升时间序列动量策略
创建于 更新于
摘要
报告介绍了深度动量网络(DMN)在时间序列动量策略中的应用,将传统的两步动量策略整合为深度神经网络直接输出头寸信号,尤其基于LSTM模型优化夏普比率,实证表明该策略显著优于基准并具有良好的风险调整收益表现。文中进一步探讨了交易成本影响及换手率正则化方法,有效缓解高交易成本环境下策略性能下滑问题,验证了LSTM结合换手率正则化在极端成本条件下的稳定性和优势[page::0][page::1][page::2][page::3][page::4][page::5]。
速读内容
1. 时间序列动量策略与深度学习结合背景 [page::0][page::1]
- 传统时间序列动量策略分为趋势强度估计和头寸生成两步。
- 本文提出深度动量网络(DMN),利用深度神经网络直接从历史数据学习头寸信号。
- 采用岭回归、MLP、WaveNet和LSTM多种模型架构,其中LSTM表现最佳。
2. 策略回测设计及数据描述 [page::2]
- 标的为88个连续期货合约(商品、固定收益、货币期货),时间区间1990-2015年。
- 模型每5年重新校准,保证完全样本外测试。
- 指标包括收益标准化、多期限收益、MACD等特征输入。
- 绩效测量采用预期收益、日波动率、最大回撤、夏普等风险调整指标。
3. 策略表现及模型比较 [page::3]

- LSTM夏普最优化模型夏普比率均值达到2.804,远超传统基准。
- MLP模型性能次之,WaveNet表现弱于简单线性模型。
- 采用夏普率最大化目标优于收益最大化目标。
| 策略 | 预期收益 | 波动率 | 最大回撤 | 夏普比率 | Sortino比率 | Calmar比率 | 正收益率 | AL |
|------------|----------|--------|---------|----------|-------------|------------|-----------|-----------|
| Long Only | 0.039 | 0.052 | 0.167 | 0.738 | 1.086 | 0.230 | 53.8% | 0.970 |
| Sgn(Return)| 0.054 | 0.046 | 0.083 | 1.192 | 1.708 | 0.653 | 54.8% | 1.011 |
| MACD | 0.030 | 0.031 | 0.081 | 0.976 | 1.356 | 0.371 | 53.9% | 1.015 |
| MLP-Sharpe | 0.044 | 0.031 | 0.154 | 1.383 | 1.731 | 0.283 | 56.0% | 1.024 |
| LSTM-Sharpe| 0.045 | 0.016 | 0.021 | 2.804 | 3.993 | 2.177 | 59.6% | 1.102 |
注:带为最优表现[page::3]
4. 换手率及交易成本影响分析 [page::4]

- 机器学习模型换手率普遍高于传统基准,约为基准的10倍。

- 交易成本递增导致策略夏普比率下降,LSTM模型在2-3bps交易成本下仍优于其他模型。
- 基准策略能适应最高5bps成本,机器学习模型多只能承受4bps。
5. 换手率正则化优化策略 [page::5]
- 在极端10bps交易成本下,直接LSTM模型表现大幅滑落。
- 引入换手率正则化后,LSTM+Reg模型显著恢复策略表现:
| 策略 | E[Return] | Vol. | Max Drawdown | Sharpe | Sortino | Calmar | Positive Return | AL |
|------------|-----------|-------|--------------|---------|---------|--------|-----------------|--------|
| LSTM | -0.833 | 0.157 | 1.000 | -5.313 | -7.310 | -0.833 | 33.9% | 0.793 |
| LSTM + Reg | 0.141 | 0.154| 0.371 | 0.912 | 1.379 | 0.379 | 53.4% | 1.014 |
- 结论:换手率正则化有效提升高交易成本环境下的策略稳定性和绩效[page::5]
6. 关键创新点总结 [page::0][page::5]
- 深度神经网络(尤其是LSTM)能有效捕捉时间序列动量信号非线性特征。
- 直接预测交易头寸优于传统两步骤方法。
- 换手率正则化为克服高交易成本的有效手段。
- 策略具备较高的样本外稳健性和风险调整表现。
深度阅读
使用深度神经网络提升时间序列动量策略 —— 详尽分析报告
---
一、元数据与报告概览
- 报告标题:使用深度神经网络提升时间序列动量策略
- 作者:吴先兴
- 发布机构:天风证券研究所
- 发布日期:2020年1月1日
- 核心文献来源:Bryan Lim, Stefan Zohren and Stephen Roberts,《Enhancing Time Series Momentum Strategies Using Deep Neural Networks》,《The Journal of Financial Data Science》,2019年秋季卷,第1卷第4期,19-38页
- 主题内容:本文探讨如何利用深度神经网络(尤其是LSTM等架构)改进传统时间序列动量策略的表现,具体关注通过深度学习模型直接从历史数据预测资产的交易头寸,评估了包括岭回归、MLP、WaveNet及LSTM等多种模型的性能,结合波动率放缩框架,重点比较不同模型的投资绩效和换手率表现,最终提出结合换手率正则化的深度动量网络模型。
核心论点:
传统时间序列动量策略通常通过两个步骤(趋势强度估计与头寸生成)来构建交易信号,本文创新地利用深度神经网络直接学习历史表现到交易头寸的映射,实证显示LSTM模型相较传统动量模型和其它机器学习模型在收益率、夏普比率等绩效指标上有显著提升。换手率过高带来的交易成本风险通过换手率正则化得到缓解,提升了模型在高交易成本情境下的表现。整体结论支持采用深度学习方法优化动量策略的设计与收益表现。[page::0,1,2,5]
---
二、逐节深度解读
1. 简介与动量策略定义
报告首先对动量策略进行分类:截面动量(Cross-Sectional Momentum)和时间序列动量(Time Series Momentum, TSMOM)。截面动量基于资产相对表现排序,买入表现强势资产;时间序列动量则基于资产自身历史表现决定其未来头寸大小。传统时间序列动量策略依赖两步法:先估计趋势强度,再产生交易头寸。文中指出这种分步骤设计带来许多手工调整和设计难题。本文尝试用深度学习模型,特别是深度神经网络,直接从历史总信息中学习趋势和头寸映射关系,省略中间明确估计步骤,称架构为“深度动量网络”(Deep Momentum Network, DMN)。深度学习架构的优势在于其高度灵活和强大的时间序列建模能力,特别是对非线性和长期依赖关系的捕捉能力。[page::0,1]
2. 模型设定与架构
公式定义了传统时间序列动量策略的收益计算方法,将策略收益表示为所有资产收益的加权和,权重由历史趋势信号和波动率调整共同形成。文中特别描述了趋势强度的传统估计方式——基于MACD指标加标准化处理,并用一个非线性函数 \(\phi(y)\) 的形式将趋势强度映射至头寸。该映射具有在中等趋势强度时放大头寸,极端趋势时回归至零的特性(图1所示),为防止极端行情造成过度交易风险。
本文引入了多种深度学习架构进行对比:岭回归Lasso、多层感知机MLP、WaveNet及长短期记忆网络LSTM。其中LSTM因其内置记忆机制,具有捕捉时间序列长期依赖的天然优势。此外,模型训练采用交叉验证,确保过拟合风险受控,通过Tensorflow的Keras API实现,可灵活替换激活函数及损失函数。[page::1,2]
3. 回测设计及结果
回测采用1990年至2015年期间来自Pinnacle DataCorp的88个连续期货合约,涵盖商品、固定收益和货币期货。数据划分采用每5年为一训练窗口,前期数据训练模型,再用未来5年数据做完全样本外测试。模型每5年重新训练与调参,保证稳健性。
输入特征方面,包含收益的标准化处理(基于不同时间窗口如1日、1月、3月、6月、1年计算),及多尺度MACD指标(短期参数8,16,32,长期参数24,48,96)以协助趋势捕捉。绩效度量使用预期收益、正收益比例、波动率、最大回撤,以及多种风险调整指标如夏普率、索提诺比率和卡玛比率。
实证结果显示LSTM(夏普率最大化训练目标)相较于基准指标(如Sgn(Return)策略)夏普比率提升超过两倍,且比所有基准机器学习方法好(图2展示了不同模型的收益和夏普率箱线图支撑此结论)。线性模型和MLP模型虽对比基本模型有所提升,但不及LSTM,说明对非线性复杂关系和记忆机制的需求驱动深度学习优胜。WaveNet模型未能取得很好表现,可能因模型复杂度超出训练数据有效调参能力。
此外,直接从历史表现映射头寸优于先预测趋势再映射头寸的两步策略。最优化夏普率目标明显优于仅最大化收益模型,说明风险考量纳入训练目标的必要性。[page::2,3]
4. 换手率分析及交易成本影响
尽管深度学习模型提升了策略回报,但带来了显著更高的换手率,平均换手率较基准提升一个数量级。图4以对数刻度展示不同策略的平均换手率,所有机器学习模型换手相近,远高于基准。
较高的换手率意味着较大交易成本压力,若不调整最终收益会被大量侵蚀。图5通过分层条状图展示策略在不同假设交易成本(0至5个基点)下的净夏普比率。结果显示基准策略最能容忍高达5bp成本,多数机器学习策略只有约4bp耐受度。但在2-3bp常见的合理交易成本下,LSTM依然领先。
针对极端交易成本环境(如10bp),报告提出换手率正则化(Trading Turnover Regularization)机制,即在模型训练中引入换手率惩罚约束,抑制过度交易行为。图6展示该正则化下LSTM模型性能明显提升,收益、夏普率、最大回撤等均优于无正则化版本,并且超过多头基准和其他传统模型,显示换手率正则化是一种实用的控制交易成本风险方案。[page::4,5]
---
三、图表深度解读
图1:趋势强度至头寸变换函数 \(\phi(y)\)
- 描述:图1展示了非线性映射函数 \(\phi(y)\) 随趋势强度 \(y\) 的变化曲线。函数在中低范围的 \(y\) 内有明确的波峰,代表中等趋势对应更大头寸,随着 \(y\) 增大到超过 \(\sqrt{2}\) 后头寸迅速收敛至零。
- 解读:此设计避免策略在极端走势涨跌时头寸过度暴露,减少亏损风险。它体现了动量策略头寸建设中的风险控制思路,可以降低极端行情对策略稳定性的侵蚀。
- 关联文本:该函数承接传统时间序列动量策略的趋势强度估计步骤,后续深度学习模型省略此步骤而直接从数据端到端估计头寸,算法设计更加简洁有效。[page::1]

---
图2:各策略收益与夏普率箱线图
- 描述:上图为不同策略的夏普率分布,下图为预期收益分布。策略涵盖基准、线性、MLP、WaveNet和LSTM模型,且区分不同训练目标(Sharpe最大化、收益最大化等)。
- 解读:
- LSTM在夏普率与收益上均表现最佳,夏普率中位数显著高于第二名MLP。
- WaveNet及简单线性模型表现均不佳,波动及极端值更大,稳定性较差。
- 直接映射头寸方式优越传统基于趋势单独预测的分离策略。
- 结论:深度学习中具备记忆力和非线性拟合能力的LSTM充分捕捉资产收益的时间结构,显著提升策略的风险调整后回报。
- 关联文本:结果支持采用端到端深度动量网络替代较为繁冗的传统策略逻辑,突出模型的投资实际有效性。[page::3]

---
图4:各策略换手率箱线图(对数刻度)
- 描述:图4展示不同策略的平均换手率,纵轴对数刻度。机器学习模型平均换手率远超基准模型,均值大约是后者十倍。
- 解读:
- 机器学习模型更频繁调整头寸,反映其对短期信息更敏感,但也带来更大交易成本风险。
- 换手率差距极大,提醒策略投资者需考虑交易费用对实际收益的显著侵蚀。
- 关联文本:本文后续采用换手率正则化抑制高换手儿,提升策略交易成本环境下的可持续性。[page::4]

---
图5:不同交易成本水平下策略夏普率变化
- 描述:图5以堆叠柱状图形式表现零至5基点交易成本时各策略夏普率。柱体顶部红色为不扣费夏普,逐渐降低到粉色5bp扣费夏普。
- 解读:
- 基准模型在5bp仍有正表现,耐受最高交易成本。
- 多数机器学习策略最高能承受4bp交易费用,超过则夏普率变负。
- LSTM模型在2-3bp交易成本区间表现依然优于其他模型。
- 关联文本:交易成本限制了深度模型实际投资适用性,凸显换手率管理重要性。[page::4]

---
图6:10bp交易成本下换手率正则化效果数据表
- 描述:表格列出多策略在极端10bps交易成本下的绩效指标,包括预期收益、波动率、最大回撤、夏普率、索提诺比率、卡玛比率及正收益比例等。
- 解读:
- 未正则化LSTM在此情形下表现极差(收益负、夏普率大幅负值)。
- 加入换手率正则化(LSTM+Reg)后,收益与夏普率大幅回升,超过基准模型,并显著改善极端风险指标。
- 正则化对交易成本敏感策略是一种实证有效的防控手段。
- 关联文本:正则化使深度动量网络能够在高交易费用环境中存活,提升策略实用性和鲁棒性。[page::5]
---
四、估值分析
本文聚焦于策略设计与实证评估,对估值定价模型及目标价没有涉及,因此本部分不适用。
---
五、风险因素评估
- 主要风险:
1. 交易成本风险:深度学习模型通常伴随高换手率,显著增加交易费用,可能侵蚀收益,导致实际收益表现不及理论。
2. 模型过拟合风险:WaveNet模型表现不佳,可能源于训练数据有限导致模型参数难以调优,深度模型在金融时序数据上的泛化性能是挑战。
3. 市场结构变化风险:动量效应可能随市场环境波动降低模型预测能力,深度模型依赖历史规律,面对新趋势可能承压。
- 缓解策略:
- 通过交叉验证与样本外测试减少过拟合。
- 换手率正则化抑制过度调整,降低实际交易成本。
- 定期模型再训练与参数优化适应市场变化。
报告虽未详述风险概率,但通过回测设计与正则化显露对关键风险的应对思路。[page::2,4,5]
---
六、批判性视角与细微差别
- 高换手率隐忧:深度模型换手率是基准的十倍,虽然收益提升明显,但高频调仓带来的隐性成本(滑点、冲击成本)未详细量化,实际净收益可能低估交易成本影响。
- 模型复杂度与表现不匹配:WaveNet作为复杂模型未能超越简单线性模型,提示金融时间序列预测虽然需要一定非线性,但过度复杂模型可能陷入局部最优或过拟合,需谨慎模型选择。
- 样本选择及时间窗口限制:回测集中于1990-2015年期货合约,全市场情况和其他资产类别的适用性需进一步验证。
- 换手率正则化权衡:正则化提升在高交易成本下表现,但是否牺牲了策略收益的最大化,权衡点可能依赖交易成本假设,需具体投资环境定制。
总的来说,报告基于充分数据和方法论支持,但对交易成本等现实因素的考量可更深入,此外模型迁移能力和适用范围需后续研究补充。
---
七、结论性综合
本报告围绕如何用深度神经网络改进传统时间序列动量策略进行了详尽分析。基于88个连续期货合约近三十年的数据集,作者提出“深度动量网络”框架,通过短期至长期多尺度收益及MACD指标喂入深度学习模型(岭回归、MLP、WaveNet、LSTM),直接预测资产交易头寸。与传统基于两阶段步骤的动量模型相比,端到端深度学习模型显著提升了策略的收益性和风险调整后绩效,其中LSTM模型在最大化夏普率目标下表现最佳,夏普率较基准模型提升逾100%。
但深度模型普遍带来显著换手率上升,换手率峰值高达传统策略的十倍,反映交易频率和成本风险显著增长。交易成本敏感性分析中,大部分深度模型只能承受最高约4bp交易成本,传统基准最高能承受5bp。为应对高交易费用环境,报告引入换手率正则化项,有效减少过度交易行为,在极端10bp交易成本下,正则化后的LSTM仍保持较优表现,显著优于未正则化版本,提升策略实用性和稳健性。
图表的深度分析揭示了趋势强度映射函数的非线性特征,展示多模型绩效分布和显著优劣,以及换手率的倍数差异与交易成本对策略风险调整收益的削弱情况。整体来看,深度学习赋能动量策略的研究具有开创性,展示了深度模型在捕捉复杂时间依赖关系中大幅超越传统方法的潜力,同时交易成本控制是其实战推广的关键瓶颈,换手率正则化为风险缓解提供可行方案。
因此,作者最终推荐采用基于深度学习、尤其是LSTM模型的动态时间序列动量策略,结合风险调整与换手率正则化,对连续期货合约市场可获得显著的策略性能提升,具备较高的实际应用价值和进一步研究空间。[page::0-5]
---
参考附件二维码及联系方式
报告后附吴先兴等分析师二维码及联系方式,方便读者交流和咨询。[page::8]
---
总结
本文从理论模型构建、深度学习架构选择、实证结果对比及交易成本敏感性分析,系统阐释了深度神经网络提升时间序列动量策略的创新思路及落地方案,重点凸显LSTM模型结合夏普率最大化训练目标的优越性及换手率正则化对于成本控制的关键作用,为投资者及量化策略设计者提供了具有实践指导意义的前沿技术方案。