`

逐鹿 Alpha专题报告(十七):基于TiDE及其改进的因子融合模型

创建于 更新于

摘要

本报告围绕基于MLP的TiDE模型及其改进版本TiDGE的构建与应用,深入分析Transformer及相关时序模型在股票收益率预测中的表现。通过引入GRU编码器增强时序信息处理能力,TiDGE相较原始TiDE模型在选股效果和回测收益率方面显著提升,年化收益率最高达到15.99%,最大回撤控制在35%以内,显示其适用性和有效性,为量化选股策略提供了新思路 [page::0][page::2][page::4][page::5][page::6].

速读内容

  • Transformer及其在时间序列预测中的应用背景 [page::1][page::2]:

- Transformer架构由encoder和decoder组成,适用于NLP和视觉任务,近年来被用于时间序列预测领域。
- TemporalFusion Transformer(TFT)采用LSTM encoder处理因子时序信息,取得良好效果。


  • 基于MLP结构的TiDE模型 [page::2][page::3]:

- TiDE模型结合静态变量、过去已知变量和未来已知协变量,采用线性Encoder和Decoder结构,实现高效时间序列密集编码。
- 模型在九大公开数据集表现优异,超过多数Transformer模型。


  • TiDE模型在A股选股应用及局限 [page::3][page::4]:

- 数据处理:使用GraphEmbedding行业因子和Alpha158、MAlpha65组合的过去已知因子,经XGBOOST筛选后保留50个高重要性因子。
- 训练样本包含2016-2020年数据,测试期为2021年,采取42天滚动训练策略。
- 原始TiDE模型未能显著带来超额收益,交易费用后表现平平。


  • TiDGE模型的提出及改进方法 [page::5][page::8]:

- TiDGE在TiDE模型中融入GRU Encoder以增强时序信息处理,克服单纯MLP和Transformer位置编码的局限。
- 模型结构包括2层Encoder、2层Decoder和2层GRU Encoder,输出维度及损失函数均专门设计。
- 截断标签长度对应未来预期收益,确保模型训练与回测精准。



  • TiDGE模型回测效果详解 [page::5][page::6]:

- 回测范围:2021年至2023年2月,全A股股票池,日频和5日频调仓。
- 主要绩效指标:
| 项目 | 日频Top400Drop40 | 5日频Top400Drop40 |
|--------------|-----------------|------------------|
| 年化收益率 | 11.69% | 15.99% |
| 年化波动率 | 0.2 | 0.21 |
| 最大回撤 | 36.19% | 35.48% |
| Alpha | 13.92% | 18.21% |
| 超额最大回撤 | 13.00% | 12.91% |
| 超额信息比率 | 1.22 | 1.47 |
| 换手率 | 8.68 | 5.18 |

- 回测曲线展现出模型显著超越基准指数的能力和较稳健的风险控制。


  • 讨论与风险提示 [page::7]:

- TiDGE通过引入GRU单元有效提升选股模型表现,融合静态和动态因子信息。
- 风险包括模型潜在的风格切换失效、随机性影响、历史区间偏差、计算资源需求等。
- 结果不构成投资建议,依赖历史数据,存在统计误差。

深度阅读

逐鹿 Alpha专题报告(十七):基于TiDE及其改进的因子融合模型——详尽分析报告



---

1. 元数据与概览(引言与报告概览)


  • 报告标题:《逐鹿 Alpha专题报告(十七):基于TiDE及其改进的因子融合模型》

- 作者:丁鲁明、王超
  • 发布机构:中信建投证券股份有限公司研究发展部

- 发布日期:2023年10月24日
  • 主题:本报告围绕以时间序列预测为核心的机器学习模型——尤其是基于MLP的TiDE模型及其升级改进版本TiDGE,重点探讨了这些模型在股票收益率预测与量化选股领域的应用及表现改进。


核心观点总结
  • Transformer在NLP和计算机视觉领域成功推动了序列建模技术的发展,其相关架构也被广泛尝试应用于时间序列预测。

- 2022年出现了基于MLP的简单结构LTSF-Linear,显示出在线性模型对比Transformer模型上有优异表现,引发大量基于MLP的时序模型提出,包括TiDE。
  • 报告基于TiDE模型进行股票收益率预测实验发现原版TiDE不适合该任务,提出加入GRU编码结构优化后的TiDGE模型,表现明显提升。

- 研究过程中结合了因子筛选、行业Embedding以及针对股票未来收益率的特定样本设计等技术手段。[page::0,1,2,3]

---

2. 逐节深度解读



2.1 提纲与模型架构介绍


  • 章节概览

- 报告先概述Transformer基础架构及其在时间序列领域的应用。
- 介绍了Transformer的Encoder-Decoder架构,强调multi-head attention及位置编码的重要性,这保证了模型可以捕获输入序列的位置信息。
  • 推理依据

- Transformer客户依赖自注意力机制捕获长距离依赖,Encoder部分可并行处理已知输入,而Decoder受限于顺序生成需要masked attention。
- 时间序列作为序列数据,Transformer架构通过位置编码也适合序列数据建模,故被引入时间序列预测。
  • 关键数据与说明

- 图1展示Transformer的详细结构模块,包含多层的多头注意力、前馈神经网络及标准化层,图示有助于理解技术细节。[page::1]

2.2 Transformer及相关时间序列模型应用


  • 重点内容

- 介绍诸多基于Transformer的时间序列预测模型,如Informer、Temporal Fusion Transformer(TFT)、PatchTST等,并指出其中TFT结合了LSTM以处理时序信息。
- 回顾了2022年MLP模型的兴起,指出简单的LTSF-Linear在多数据集上表现优于Transformer,带动了基于MLP的模型快速发展。
  • 理论依据

- Transformer的注意力机制具有排序不变性,无法天然区分序列时序,需要借助位置编码或其他结构处理。
- LTSF-Linear模型简洁且在长短期时序数据中表现良好,说明复杂的Transformer结构未必优势明显。
  • 关键图表解析

- 图2图示了LTSF-Linear模型如何基于历史序列线性映射预测未来序列,强化了简单MLP结构的直观理解。
- 表1列出九个流行LTSF数据集统计属性,以及不同模型在MSE、MAE指标下的表现对比,显示线性模型多数指标领先Transformer变种。
- 另有TiDE结构图示显示其编码器-解码器的简洁拼接结构,展示其时间和空间效率的优势。[page::2]

2.3 TiDE模型详细介绍与表现


  • 模型架构

- TiDE输入静态变量(GraphEmbedding行业因子)、过去已知变量(Alpha158+MAlpha65+市值因子)、未来已知协变量(日、月、周等日期特征),三类变量拼接进入线性编码器-解码器。
- 结构简洁,时空效益好,最终预测通过残差连接生成。
  • 模型性能与回测

- 对比多数据集模型测试,TiDE模型在大部分数据集上表现为最佳或并列最佳,凸显其时间序列预测竞争力。
- 股票池采用全A股,训练集时间2016-2020年,测试2021年,10天历史序列预测未来1天收益率。样本采用滚动训练。
- 回测结果显示,考虑交易费用后,原始TiDE未能显著产生超额收益,表明TiDE不足以捕获股票收益的特征。
  • 关键图表

- 多个图表展示了TiDE在不同股票池、指标体系下的表现曲线,表现出较强的拟合能力但超额收益有限。
- 图示滚动训练和样本构造能够有效阐释模型的时间序列输入和预测目标定义。[page::3,4]

2.4 TiDGE模型:基于TiDE的改进


  • 改进动机

- Transformer和MLP结构本质上是输入顺序不敏感的,位置编码和时间变量引入虽增加序列顺序信息,但处理能力有限。
- TFT采用LSTM作为编码器,能更好地捕获时序依赖,启发本文引入GRU编码器改进TiDE,形成TiDGE模型。
  • 模型结构

- TiDGE在原始TiDE编码器前端增加GRU编码器层处理序列特征,增强时序信息捕获。
- 训练中标签y截断为L-T长度,适应未来T天收益的预测需求。
  • 参数设定

- Encoder及Decoder层数均为2层,输出尺寸分别为64和8,GRU编码器大小32,层数2。
- 损失函数采用均方误差(MSE),优化器使用Adam。
  • 回测设计与结果

- 选取TopK为400的股票池,测试期2021年至2023年2月,频率T天,基准为中证全指,成交价用次日收盘价。
- 回测收益随着持仓规模扩大呈现递减趋势,Top40的年化收益最高达到约11.7%。
  • 图表详解

- 模型结构图清晰说明GRU如何嵌入,及其与主编码器、解码器的融合方式。
- 年化收益柱状图揭示回测策略收益和规模的关系,体现模型的实盘潜力。
  • 后续图示更多频率(3日、5日)回测结果,表现更佳,年化收益分别提升至11.69%、15.99%,波动率约0.2,最大回撤36%附近,Alpha明显,信息比率约1.2-1.5,换手率适中(5-8%),显示较好的风险收益特性。[page::5,6,8]


2.5 讨论与风险提示


  • 讨论总结

- 静态行业变量、过去和未来已知协变量均被验证有效地融合于收益率预测。
- TiDE模型直接用于股票收益预测效果有限,但通过加入GRU编码器单元的TiDGE模型表现明显提升。
  • 风险提示

- 历史数据模型结果不代表未来表现,存在风格切换带来因子失效风险。
- 模型训练有随机性,初始化和样本区间可能影响结果。
- 模型参数和计算资源分配不足存在欠拟合风险。
- 本报告信息仅供机构类专业投资者参考,不构成投资建议。
  • 免责声明和分析师声明内容体现了合规严谨的风险管理意识。[page::7]


---

3. 图表深度解读



Transformer架构图(图1,Page 1)


  • 描述:展示了Transformer的Encoder与Decoder结构,包含输入嵌入、位置编码、多头注意力机制、前馈网络及归一化层。

- 含义:强化理解Transformer序列映射过程,Encoder并行处理历史输入,Decoder顺序生成输出,关键在masked attention实现文本生成或时序预测逻辑。
  • 联系文本:通过结构图直观说明Transformer构成,为后续改进模型奠定技术基础。

- 潜在局限:Transformer未包含时序隐含,需位置编码补充,且缺乏直接处理序列依赖的结构。

LTSF-Linear模型示意图(图2,Page 2)


  • 描述:展示线性映射形式将历史L个时间步输入映射预测未来T时间步输出。

- 趋势说明:强化直观简单的MLP结构可以处理长短期序列,减少结构复杂度带来的过拟合风险。
  • 文本连接:支持MLP模型在时间序列上胜过Transformer的实验结果。

- 局限性:简单线性不可捕获复杂非线性依赖,需适当扩展。

数据集性能表(Page 2)


  • 内容:9个常用时间序列数据集上,线性模型和Transformer对比MSE、MAE指标的详细表现。

- 趋势:多数数据集中线性模型取得最好或接近最好结果,挑战Transformer的统治。
  • 文本连接:支撑报告采用基于MLP的TiDE模型选股的合理性。


TiDE模型结构图(Page 2-3)


  • 内容:清晰展示TiDE输入变量如何被线性编码器、解码器处理,处理静态变量、历史变量和未来协变量的流程。

- 趋势:简洁的架构与高效率并行处理提升模型实用性。
  • 支持点:证实报告对时间序列预测效率与性能的双重关注。


股票池训练与回测示意图(Page 4)


  • 描述:滚动训练窗口与样本构造模块,突出模型滚动训练策略及预测方法。

- 意义:滚动方法保证模型动态适应市场变化,样本设计紧密结合实际投资场景。

TiDGE新增GRU结构示意(Page 5 & 8)


  • 描述:图示加入GRU编码器模块,作为时间序列特征提取层,与原有Encoder、Decoder及残差连接方式相结合。

- 趋势:增强模型对时序依赖关系的捕获能力。
  • 联系论点:与TFT改进思路相似,改变Transformer或MLP排序不敏感缺陷。


回测收益柱状图(Page 5)


  • 内容:不同TopK股票池规模与年化收益的关系,收益随着持仓数递减,top40回报最优。

- 趋势:资本集中度收益率更高,表明模型选股能力显著。
  • 对投资实操价值说明:表明TiDGE策略在实际选股中的收益潜力和风险管理考虑。


回测绩效曲线及统计指标(Page 6)


  • 描述:不同频率下Top400股票池剔除表现最差股票后的回测累计收益、超额收益、波动率与回撤展示。

- 趋势:模型实现正的Alpha,波动率控制在合理范围,回撤水平可控,信息比率较高。
  • 风险收益平衡清晰体现


---

4. 估值分析



报告核心聚焦于Alpha因子模型开发和时序预测模型优化,未涉及传统估值方法(如DCF、P/E等)的具体探讨,无估值目标价格或股价预测。

---

5. 风险因素评估


  • 因子失效风险:市场风格转换可能导致历史因子预测失效。

- 模型随机性:初始化和超参调整对结果存在不稳定影响。
  • 数据区间选择:训练集和测试集时间区间差异可能影响模型稳健性。

- 计算资源限制:不足的计算资源会导致模型欠拟合。
  • 统计误差:历史表现不代表未来,所有模型结论均具统计误差可能。

- 报告明确未构成投资建议,强调合规风险提示。

报告未详述风险缓解策略,主要提示注意模型局限和市场不可控因素。[page::7]

---

6. 审慎视角与细微差别


  • 报告强调模型改良通过引入GRU编码器提升序列时序处理能力,体现出了对Transformer及MLP固有排序不变性缺陷的深刻洞察,逻辑清晰。

- 不过,实际盈亏回测尚未体现完全的稳健(最大回撤较大,波动率非极低),模型结论仍需在更多市场环境下验证。
  • 部分模型指标对比依赖历史标准化数据集结果,存在泛化性未知风险。

- 报告中强调了统计误差和模型随机性对结果不确定性的影响,体现较好的审慎态度。
  • 由于报告未展示细节模型的训练时间、超参数调优过程,留待后续深入。

- 无具体披露行业Embedding的构造细节,影响模型解释力的深入剖析。

---

7. 结论性综合



本报告系统深入地介绍了基于近年来兴起的时间序列MLP模型TiDE及其在量化选股领域的应用尝试。报告说明纯TiDE模型在股票收益率预测中的表现欠佳,交易费用摊销后无超额收益,指出纯线性MLP结构面临时序信息处理局限。借鉴TFT等基于LSTM的时序模型思想,作者将GRU编码器引入TiDE,形成改进模型TiDGE,实质上解决了排序不变性导致的顺序信息不完整问题。通过大量滚动训练与回测,TiDGE模型实现了较优的年化收益率表现(Top40超过11%),Alpha显著且风险承受合理,尤其在多频率测试下验证了其稳健性。

报告内容结构严谨,结合了行业Embedding特征筛选及充分的实验支撑,清楚说明了因子融合模型改进的技术路径和业务价值。报告在风险提示部分展现了良好合规意识,提醒用户注意模型统计误差及市场风格切换风险。

所有关键的图表均详尽展示了模型构架、数据预处理、训练方式、以及回测收益率曲线和绩效指标,通过图文结合深化了对模型原理及实操表现的理解。

总体上,报告以严谨的技术路线与充分的实证验证,指出了纯MLP模型在金融时间序列预测中的不足,提出融合GRU编码器的改进方案,对股票预测模型设计和因子融合提供了有益参考,体现了在量化金融工程领域的创新与实践价值。

---

参考文献与数据溯源均严格对应各页码:
  • 引用技术模型与创新点综合自[page::0,1,2,3]

- 细节模型架构及训练回测[page::4,5,6,8]
  • 讨论与风险提示内容来源[page::7]

- 附录和免责声明见[page::7,8,9]

---

总结



本报告以“逐鹿 Alpha专题报告(十七)”为载体,深入探讨了基于TiDE模型及其GRU改进型TiDGE的因子融合模型在股票收益率预测中的应用,图文并茂地展现了模型设计、实现细节、回测表现及风险提示。通过引入时序编码结构,提升了模型在序列数据中的预测能力,实验验证显示实际投资回报显著提升。报告内容技术含量高且逻辑严密,适合机构量化策略研发人员及金融工程领域研究学者深入学习借鉴。[page::全文]

---

以上为该研究报告的全面详尽解构与深度分析。

报告