“逐鹿”Alpha专题报告(十七):基于TiDE及其改进的因子融合模型
创建于 更新于
摘要
本报告基于TiDE及其改进模型TiDGE探讨了时间序列深度学习模型在股票收益率预测中的应用。研究指出,原始TiDE模型对选股效果有限,而通过引入GRU结构改进的TiDGE模型,显著提升了时序信息处理能力和预测表现。回测显示,TiDGE策略在全A股池内实现了较好的年化收益和信息比率,且回撤控制较优,为量化选股提供了新的思路和方法 [page::1][page::7][page::14][page::16][page::17][page::20]
速读内容
- 报告背景与模型应用概览 [page::1]
- Transformer及其变种在时间序列预测领域广泛应用,包括Informer、Temporal Fusion Transformer、PatchTST等模型。
- 2022年提出的MLP结构Linear模型在多个数据集超过Transformer表现,为TiDE模型的提出奠定基础。
- TiDE模型架构与优势 [page::7][page::8]

- 采用静态变量、过去已知变量、未来已知协变量作为输入,通过线性Encoder和Decoder进行时间序列建模,效率高。
- 在多个主流时间序列预测数据集上,TiDE模型的预测误差指标(MSE, MAE)优于其他先进模型。
- 样本选取与特征处理 [page::10][page::11]
- 股票池覆盖全A,训练集2016-2020年,测试集2021年起,42天滚动训练频率。
- 采用Graph Embedding行业指标、Alpha158及MAlpha65因子,使用XGBOOST筛选重要特征,进行截面归一化。
- 滚动训练与标签处理流程 [page::12]


- 利用长度为L的历史时序输入变量预测未来T天收益率,滚动方式训练模型,保障样本充分利用。
- TiDE模型实盘表现 [page::13]

- 考虑交易成本后,原始TiDE模型未能带来明显的超额收益,体现模型对复杂金融时序的适用性有限。
- TiDGE模型改进结构及参数设置 [page::14][page::15]


- 引入GRU Encoder结构增强时序信息提取能力,标签输入截断匹配预测窗口。
- Encoder层数2,输出尺寸64;Decoder层数2,输出8;GRU Encoder大小32,共2层,损失函数MSE,优化器adam。
- TiDGE策略回测效果及风险指标 [page::16][page::17][page::18]



- Top400股票池年化收益率11.69%(3日频率)至15.99%(5日频率),最大回撤约35%左右,信息比率及alpha表现稳健。
- 交易频率合理,换手率适中,有效控制风险并实现信息比率提升。
- 结论与讨论 [page::20]
- 原始TiDE模型选股效果有限,加入GRU后TiDGE模型在时序信息捕捉上更优,提升了策略表现。
- 静态行业变量与各类历史和未来时间变量融合,有效增强模型预测股票收益率的能力。
深度阅读
证券研究报告详尽分析报告
基于TiDE及其改进的因子融合模型的深度剖析
---
1. 元数据与报告概览
- 报告标题:
“逐鹿”Alpha专题报告(十七):基于TiDE及其改进的因子融合模型
- 分析师:丁鲁明,王超
- 发布机构:中信建投证券研究发展部
- 发布日期:未显示具体日期,但内容更新时间至2023年初至2月
- 主题:
报告聚焦时间序列预测模型中的TiDE模型及其改进模型TiDGE,将其应用于股票收益率预测和选股策略中。探讨传统基于Transformer的模型和近期MLP模型在线性时序预测中的表现,针对TiDE模型的不足,引入GRU结构形成TiDGE以提升对股票市场时序信息的捕捉能力。
- 报告核心论点与结论:
近年来,Transformer结构在NLP和计算机视觉中表现突出,同样吸引大量时间序列预测模型基于此架构推出,但实证表明简单的线性MLP模型在时间序列预测中也能超越很多Transformer模型。Google提出的基于MLP的TiDE模型在不少数据集表现优异。
然而,直接将TiDE用于股票收益率预测表现一般,本文通过在TiDE中嵌入GRU单元,创新了TiDGE模型,增强了时间序列信息处理,回测结果显示TiDGE策略获得了显著超额收益。
因此,本文既是一篇技术模型介绍,也涉及实证选股策略,提出了基于深度学习时间序列模型改进的投资方法。[page::0,1,7,14,20]
---
2. 逐节深度解读
2.1 核心观点与背景介绍
报告指出,时序预测领域借鉴Transformer架构但仍存在改进空间。论文“Are Transformers Effective for Time Series Forecasting?”发现简单线性MLP模型在多数据集大都能跑赢Transformer系列,激发后续多款基于MLP的时序模型问世诸如MTS-Mixers、TSMixer和TiDE。本文尝试用TiDE模型进行选股实验,发现其表现一般,提出在TiDE加入GRU编码器形成TiDGE,明显提升预测能力,有望改善选股表现。[page::1,6,7,14]
2.2 TiDE模型介绍
- 结构:TiDE基于MLP,由线性编码器(Encoder)和解码器(Decoder)组成,将静态变量、过去已知变量和未来已知协变量拼接,通过线性层输出预测。模型简洁,计算效率高。
- 输入变量:
- 静态变量如行业Embedding
- 过去已知变量如历史Alpha因子、市值等
- 未来已知协变量如时间信息(日周月等)
- 残差连接:从历史输入直接线性残差到预测,强化信息传递。
- 表现优异:在多个标准时间序列数据集上,TiDE相较PatchTST、N-HiTS等表现优异,综合误差指标(MSE、MAE)居前。
- 架构精图(见报告图7页),展示TiDE整体流水线设计,残差块采用ReLU激活及标准的Layer Norm与Dropout技术。[page::7,8]
2.3 Transformer及基于Transformer的时序模型简述
报告复述Transformer结构及Attention机制,强调其编码器采用并行注意力机制,解码器采用顺序masked机制,需位置编码补时序信息。随后介绍时间序列Transformer模型如Informer,TFT(Temporal Fusion Transformer)等,TFT结合LSTM编码器,更擅长捕捉时序依赖,用于因子选股中有成功应用先例。[page::4,5]
2.4 相关文献中的线性MLP模型表现
- 报告引用2022年论文数据集统计(ETTh1,Traffic等多个公开数据集),时间粒度从分钟到小时不等。
- 实证比较显示LTSF-Linear模型在各种测试指标(MSE和MAE)上通常优于Transformers和复杂模型,说明简单线性模型尤其在长期时间序列预测中具备优势。
- 再结合华为MTS-Mixers和谷歌TSMixer说明MLP模型是时序预测研究热点。
- 该部分图示(6页)清晰呈现多模型对比结果,线性模型普遍具备更低误差。[page::6]
2.5 TiDGE模型创新与实现
- 由于原TiDE模型对时间序列的顺序信息捕捉不足(因MLP和Transformer Attention具有排序不变性,需额外位置编码),引入了GRU/LSTM单元增强时序依赖处理。
- TiDGE通过切割未来收益率标签时间步,避免信息泄露。
- 网络整体结构为拼接历史收益率序列(减去未来预测长度)、其他变量,先通过Encoder和GRU编码,Decoder再输出,最后做残差加和预测。
- 参数设置详细,Encoder和Decoder均为两层,编码尺寸64,GRU编码器尺寸32,Adam优化,损失函数MSE。
- 该模型架构图显著区别于TiDE,突出GRU编码器的引入。[page::14,15,23]
2.6 数据与特征选择
- 股票样本:覆盖全A股。
- 训练期为2016至2020年,测试自2021年起,滚动训练间隔为42天,时序长度10,预测未来1天收益率。
- 特征分为静态行业embedding、过去因子(Alpha158及MAlpha65,市值因子)和未来已知协变量(日期指标)。
- 采用XGBOOST筛选重要特征,保留过去已知变量中高相关性的因子,减少维度,减轻计算负担。
- 对过去因子做截面归一化,保证数据稳定。[page::10,11]
2.7 滚动训练及样本构造
- 每只股票时间序列样本由历史时间窗口L构成,预测窗口H天,加标签T天作为训练目标。
- 滚动训练策略图示展现多时间步序列样本滚动更新,用于提升训练数据覆盖及模型泛化能力。[page::12]
2.8 实证结果解读
- 纯TiDE模型未能在考虑交易费用情况下实现显著超额收益,表明其时间序列处理能力不足以捕捉股票收益复杂动态。
- TiDGE模型引入GRU后,显著改善选股效果:
- 回测覆盖2021年至2023年2月,全A股池,下单频率1日,Top400筛选,未剔除股票(Ndrop= N)。
- 年化收益最高至15.99%(5日频率),最大回撤35%左右,alpha超过18%,信息比率1.47,且换手率较合理,表明策略稳健且可实施。
- 多组频率和TopK组合对比图表(16-18页)显示收益波动规律及组合规模扩展的影响。
- 图指标如年化收益、最大回撤、alpha和超额信息比率等综合反映出TiDGE策略的良好风险调整后表现。[page::13,16,17,18]
---
3. 图表深度解读
- 图4 (页4):Transformer经典架构图
展示了Transformer中Encoder与Decoder的多层多头注意力结构。位置编码强调需要额外处理时序信息。
- 图5 (页5):Temporal Fusion Transformer结构图
全面展现TFT模型复杂模块,如LSTM编码器、可变选择网络(Variable Selection Network)和门控残差块,解析其在时间序列多阶段预测的机制优势。
- 表1-2 (页6):LTSF多个公开数据集统计与多模型误差比较
显示不同模型(Linear及Transformer系列)在多任务长时预测中的MSE/MAE。线性模型占多数数据集最优,凸显简洁模型优势。
- 图7 (页7):TiDE模型整体结构图
直观展示三类输入变量处理流程,编码解码机制及残差块,体现TiDE模型简洁明了且高效。
- 表8 (页8):TiDE与多种时序模型对比
MSE与MAE指标显示TiDE在部分预测长度表现优越,但效果波动大。
- 图12 (页12):滚动训练时间序列示意
解释样本构造与训练窗口滚动,标记收益率作为学习标签。
- 图13 (页13):TiDE选股策略回测累计收益曲线等
各类净值曲线对比,显示未扣费时TiDE无明显超额收益。
- 图14 (页14):TiDGE结构图
重点加GRU编码器,增强序列依赖捕获,结构更复杂。
- 图15 (页15):TiDGE详细参数设置图
与前图类似,明示核心超参数与训练配置。
- 图16-18 (页16-18):TiDGE模型回测不同TopK和频率配置下的收益及风控指标柱状图与累计收益曲线
展示多参数组合带来的年化收益、波动率、最大回撤及换手率的变化趋势。
- 图23 (页23):TiDGE引入GRU处理动态协变量的进一步结构示意,说明模型对过去因子也使用GRU编码,适应复杂时序依赖。[page::4,5,6,7,8,12,13,14,15,16,17,18,23]
---
4. 估值分析
本报告为专题技术及模型研究为主,并无传统意义上的股票估值逻辑、目标价或评级推荐。报告核心集中于时间序列模型搭建与实证回测。
投资建议及评级部分仅展示通用中信建投评级说明,未针对具体标的给出个股买卖评级。[page::24]
---
5. 风险因素评估
报告明确指出以下风险:
- 因子可能因市场风格切换失效,导致模型预测偏差扩大。
- 模型训练存在随机性,初始化不同可能带来结果波动。
- 历史数据区间选择会影响模型表现,存在样本偏差风险。
- 模型参数设定影响预测结果,不同配置结果可能差异较大。
- 模型计算资源需求大,计算能力不足可能导致欠拟合风险。
- 所有数据均来自历史,未来有效性无法保证,投资建议不构成投资保证。
总体风控强调模型统计性质的固有局限,以及选股模型对基础假设的敏感性,提醒读者谨慎使用。[page::21]
---
6. 批判性视角与细微差别
- 潜在偏见:报告来自券商量化研究部门,存在一定自我推介倾向,报告重点突出TiDGE改进效果,缺乏对改进不足和存在局限的深入讨论。
- 模型验证:实证收益突出,但交易成本、市场冲击成本等现实交易阻力未详尽披露,回测环境是否完全反映实际交易情况尚不得而知。
- 风险提示相对简约:虽然列举风险,但未展开详细缓释方案或模型风险监控框架描述。
- 方法局限:对比基准多聚焦于公开时序数据集和历史股票池,模型的行业适用性、稳定性及鲁棒性待进一步验证。
- 内部小矛盾:TiDE原模型简单,嵌入GRU提升后模型复杂度增加带来计算成本和训练稳定性的影响未具体说明。
- 信息泄露防范:对标签截断处理和时间步长界定提及较简,尚不够详实。
- 表述细节:部分数据表格式因转换异常导致文本展现不完整,阅读时需注意数据正确解读。
综上,报告整体信息透明度较好,但模型的产业适用及未来稳定性仍需更多外部验证支持。
---
7. 结论性综合
本报告整体围绕时序预测领域最新进展,从Transformer架构,到轻量级MLP模型,再到结合RNN能力的TiDGE模型,系统展示了如何用最新深度学习方法解决股票收益率预测难题。核心发现和贡献明确:
- Transformer自2017年风靡NLP及视觉领域,时间序列预测中广泛应用;
- 近期研究发现简单线性MLP模型在部分数据集上超越复杂Transformer结构;
- Google提出的TiDE模型以其线性Dense Encoder/Decoder架构在时间序列长预测中表现出色;
- 原始TiDE模型在股票收益率预测中表现平平,对时序依赖处理不足尤为明显;
- 引入GRU编码器改进TiDE,形成TiDGE模型,有效提升时序信息抽取能力,实证展示显著的超额收益和风险调整表现(年化收益率最高15.99%,alpha超18%,信息比率1.47,最大回撤控制在35%以内);
- 选股策略涵盖全A,实时滚动训练样本,结合XGBOOST筛选重要因子,有效缓解过拟合风险和计算负荷;
- 风险提示体现模型对历史数据依赖和参数随机性的敏感;
- 报告的图表体系完备,数据与模型结构图文并茂,辅助理解各模型架构、参数设定及实证效果。
报告明确体现了深度学习模型在量化投资领域的探索方向,即将高级时序感知能力与高效轻量计算结合,为选股量化策略注入新活力。技术升级的实证效果鼓励后续在沪深市场进一步推广与深度优化。
鉴于报告定位为方法论及模型研究,未给出具体投资标的评级,但可观察到作者对TiDGE策略的积极认可,鼓励市场关注该方向的技术进步。[page::0,1,4,6,7,8,10,12,13,14,16,17,21]
---
总结:
本报告通过详实的理论介绍、丰富的数据对比与实证回测分析,展示TiDE模型及TiDGE改进模型在时间序列股票收益率预测中的应用价值。TiDGE模型凭借GRU单元对时序依赖的强化,显著提升了选股策略表现,展现了深度学习技术与传统金融因子融合的潜力。同时,报告强调模型包含风险及局限,为后续研究与实务应用提供了宝贵参考。整体而言,该专题报告专业性强,信息量充足,是当前股票量化研究领域的有益补充。