`

“逐鹿”Alpha 专题报告(九)——基于 QLIB ALPHA360 的 Temporal FusionTransformer 选股模型

创建于 更新于

摘要

本文基于微软亚洲研究院开源的量化平台QLIB ALPHA360因子体系,选取表现最优的20个因子,结合2021年提出的Temporal FusionTransformer(TFT)深度时间序列模型,对中证500成份股未来一日收益率进行预测。通过TopKdropN仓位调整策略回测,与传统ICIR加权方法相比,TFT模型在收益率、信息比率及换手率控制方面均表现优异,尤其在参数调节至换手率较低时,实现约19.57%年化收益率和1.74信息比率,展现出更稳健的风险收益特性[page::0][page::3][page::23]。

速读内容


QLIB数据与因子筛选分析 [page::4][page::7]

  • QLIB提供高效数据存储结构,支持因子表达式自定义,具备丰富算子库,适合量化因子构建和时间序列处理。

- 比较ALPHA158和ALPHA360因子的IC与IR分布,结果显示ALPHA360因子整体和头部表现优于ALPHA158,最终选取ALPHA360表现最佳的20个因子输入模型。
  • 主要选用的20因子指标如LOW2、VWAP3、OPENO等的IC均在0.05-0.07区间,IR均在0.35-0.43区间,因子质量良好。




Temporal FusionTransformer模型结构及训练 [page::10][page::11][page::17]

  • TFT模型为基于Transformer的时间序列预测深度学习网络,支持静态、观测和已知未来变量输入,具备多步及分位数预测功能,增强模型解释力。

- 采用LSTM编码器替代传统Transformer Encoder以更好处理时序信息,设计可解释性的Masked Multi-Head Attention机制。
  • 使用分位数损失函数优化,训练集样本约60万,BATCH SIZE为512,训练收敛快速,验证集误差稳定,模型参数如hiddenlayersize=160,num_heads=4。





模型表现对比及策略优化 [page::18][page::19][page::20][page::21][page::22][page::23]

  • 传统ICIR加权策略年化收益率8.92%,信息比率0.53,换手率37.34,回撤26.33%,表现平稳但波动较大。

- TFT策略显著提升表现,TFT(50,5)年化收益率达15.94%,信息比率1.22,换手率17.36%,回撤29.43%,风险收益均衡性改善。
  • 进一步调整参数N,发现N=1时策略收益达顶峰,年化19.57%,信息比率1.74,换手率4.6,回撤25.99%,显著超越传统方法,且换手率更接近中长期持仓策略。







策略绩效关键数据对比表 [page::19][page::21][page::23]



| 指标 | ICIR加权 | TFT(50,1) |
|--------------|-----------|------------|
| CAGR | 8.92% | 19.57% |
| ExMDD | 21.65% | 16.90% |
| MDD | 26.33% | 25.99% |
| Alpha | 4.92% | 15.57% |
| Beta | 1.05 | 0.99 |
| Stdev | 0.26 | 0.24 |
| Sharp | 0.50 | 1.00 |
| IR | 0.53 | 1.74 |
| Turnover | 37.34 | 4.60 |
  • 表格清晰展示了TFT模型相比传统ICIR加权在各项风险调整收益指标上的优势,且换手率显著降低,提高了策略的适用性与稳定性[page::19][page::21][page::23]。

深度阅读

证券研究报告“逐鹿”Alpha专题报告(九)——基于QLIB ALPHA360的Temporal Fusion Transformer选股模型详尽分析报告



---

一、元数据与概览



报告标题: “逐鹿”Alpha专题报告(九)——基于 QLIB ALPHA360 的 Temporal Fusion Transformer 选股模型
作者: 丁鲁明(首席分析师)、王超(研究助理)
发布机构: 中信建投证券
发布日期: 2022年5月24日
研究主题: 基于量化因子和深度学习时间序列模型(Temporal Fusion Transformer,简称TFT)对中证500成份股未来一日收益率进行预测及选股策略回测分析。

核心论点及目标:
本文基于微软亚洲研究院开发的开源量化平台 QLIB 提供的 ALPHA 因子系统,挑选表现优异的 ALPHA360 因子,结合前沿的深度学习时间序列模型 TFT,对中证500成分股未来收益率进行预测。结果显示,基于 TFT 的选股策略相比传统的 ICIR 加权策略,在收益率、信息比率(IR)以及换手率等多项关键指标上均表现更优,能够为投资管理提供有效的模型支持。[page::0,3]

---

二、逐章节深度解读



1. 简介与研究目标(第0、3页)


  • 背景说明:深度学习技术,尤其是Transformer结构,在NLP和计算机视觉领域取得突破后,开始试水时间序列预测。TF T模型是Google Cloud AI在2021年提出,结合了时间序列特征预测中的静态变量、观测输入与已知未来信息,兼具多步与分位数预测能力。

- 研究意图:利用QLIB中更丰富且表现更好的ALPHA360因子集,通过TFT对中证500成分股未来一日收益率进行预测,构建选股模型,并与传统ICIR加权因子组合做对比,验证模型优越性。
  • 同时,本文提出“TopKdropN”动态调仓策略方法,通过参数调整实现与中长期策略换手率对比,力求收益稳定性最优。


总结:研究紧密结合数据、模型与策略回测,旨在实现机器学习模型提炼复杂非线性因子信息,提升选股性能。[page::0,3]

---

2. 数据介绍(第4-7页)


  • QLIB数据平台框架(图表1,第4页)

QLIB包含数据层(本地/远程数据服务)、训练模块(从线性回归到深度学习)、模型管理与决策模块、执行环境及在线服务。数据服务模块提供高性能数据存储并支持自定义数据导入。
  • 数据来源与存储结构(图表2,第5页)

QLIB以美股和A股的基础行情数据为原始输入,数据分三大类:特征数据(如开盘价、成交量等各种因子),日历信息,指数成分股池。每只股票单独目录存储对应因子,因子存储采用高性能压缩文件,支持时间序列高效填充更新。
  • 表达式算子与因子定义(图表3、4,第6页)

QLIB通过表达式定义灵活因子计算,支持元素级与滚动时间序列运算算子。
ALPHA158为经典技术指标类因子(16数量级),ALPHA360为暴力组合的因子(360数量级),代表两种因子生成体系。此处选择因子来源对后续模型表现至关重要。

结论:数据基础充足、结构合理,便于模型灵活调用多维度、时序数据。[page::4-7]

---

3. 因子筛选(第7-8页)


  • 样本与时间段: 使用2010-2015年中证500成份股历史数据为训练集,利用WIND基础数据替代原雅虎财经数据。

- 方法: 利用信息系数IC及信息比率IR评价因子表现,筛选IR±20个表现最优的因子。
  • 结果(图表5、6、第7页):

- ALPHA360表现优于ALPHA158,无论是IC中位数(ALPHA360中位数更高)还是IR值。
- 最终选取ALPHA360表现最优秀20个因子作为建模输入(如LOW系列、VWAP系列等)。
  • 讨论: 尽管IC是线性相关度指标,难以揭示因子非线性关系,但选择IC为因子筛选有助于公平对比传统线性方法与深度学习的效果,而后者能充分挖掘非线性。


总结:筛选过程牢牢基于历史因子预测能力,确保输入因子具有基本的稳定预测信号,为后续深度模型奠定基础。[page::7-8]

---

4. 模型介绍(第8-13页)


  • Transformer简介(第8-9页,图表8-9)

Transformer架构基于Multi-head Attention机制,拥有encoder-decoder结构,编码输入序列,采用位置编码保留序列信息,近年突破自然语言处理束缚,向图像、音频、时间序列扩展。与CNN相比,Transformer泛化能力强,但需要更多数据训练。
  • 时间序列Transformer分类(图表10,第10页)

时间序列Transformer根据编码器结构(位置编码、注意力机制、架构层)与应用领域(预测、异常检测、分类)细分多种变体,TFT是其中创新代表。
  • Temporal Fusion Transformer(TFT)优势(第10-11页)

TFT结合LSTM与Transformer自注意机制,能处理静态变量、观测变量和已知未来变量,支持多步预测与预测置信区间并输出各变量的重要性解释,提升预测建模的解释性和准确性(图表11,输入结构示意)。
  • TFT结构详解(图表12,第11-13页)

模型包括输入层(通过变量筛选网络动态赋权)、LSTM Encoder-Decoder架构与“门控残差网络”(GRN),多头注意力层改进(共享权重的加权平均替代线性组合),融合静态信息增强模型表现。
  • 损失函数设计(第12-13页)

使用多个分位数的加权损失函数(Quantile Loss),实现对不同置信区间的联合拟合,提升模型对风险分布的预测能力。
  • 训练数据与归一化处理(第13页)

采用2010–2015年样本训练,ALPHA360因子标准化,测试与验证集基于训练集均值方差标准化。

总结:论文结合时序深度学习前沿算法,设计结构严谨,聚焦多局部变量特征的非线性关系刻画,并充分利用静态与时间结构信息,提升预测准确度与稳定性。[page::8-13]

---

5. 模型训练与模型库(第13-17页)


  • 模型库(Model Zoo)简介(第14页)

QLIB集成多种传统(GBDT、LightGBM、CatBoost)及深度学习模型(MLP、LSTM、GRU、Transformer、TabNet、TFT等),并对各模型在ALPHA158和ALPHA360数据集上表现进行了汇总对比。(图表14、15,第15-16页)
  • 模型表现对比:

- 在ALPHA158数据集,TFT表现中等,优于部分传统模型,但不及LightGBM、DoubleEnsemble等。
- 在ALPHA360因子集,深度学习模型整体表现有所提升,具体参数调整影响较大,因子选择敏感。
  • 自有TFT模型训练(第17页)

- 本文未直接调用QLIB集成的TFT,而将筛选的ALPHA360因子和其它未来已知变量(日期标签、周几、月份等)输入自建模型框架。
- 配置参数详见图表16,包括分位数输出(0.1、0.5、0.9)、隐藏层大小160、堆叠层数1、dropout 0.1等。
- 训练集样本量约60万,采用GPU训练,批次512,单epoch约20分钟(图表17训练集误差与图表18验证集误差表现,见第17页)。
  • 训练动力学与难点:

- 验证集损失在第2轮取得最低,后续出现过拟合风险,说明样本信号噪音较大且难以长期学习拟合。
- 股票收益率属于低信噪比数据,EPOCH过多无法改善泛化效果。

总结:模型训练过程合理设置且充分考虑时间序列复杂性及数据噪音,验证了深度模型对复杂非线性高维数据的适用性及局限性。[page::13-17]

---

6. 模型回测与策略表现(第18-23页)


  • 策略设置与对比(第18-20页)

- 采用“TopKdropN”动态调仓策略,以预测分数买入前K只股票,并每日卖出得分最低的N只,买入得分最高的N只。
- 对照组为传统基于ICIR加权的因子组合,参数K=50,N=5。回测区间2018.01.29–2021.12.31,中证500股票池,手续费双边万二。
  • ICIR加权策略表现(图表19-20,第19页)

- 年化收益率8.92%、超额收益4.92%、最大回撤26.33%、换手率37.34,信息比率0.53。
- 收益曲线波动大,特别是2018年上半年和2020年下半年表现稍好,2021年后略显疲软。
  • TFT(50,5)策略表现(图表21-22,第20-21页)

- 年化收益率提升至15.94%,超额11.94%,最大回撤29.43%,换手率下降至17.36,信息比率提升到1.22。
- 收益更稳定,回撤除个别时间点外多数时期低于20%。
- 体现出TFT模型能充分识别更复杂的非线性因子组合信号,相较传统方法提供更优风险收益表现。
  • 策略优化:换手率与收益关系(图表23-24,第21页)

- N值变化导致换手率和收益显著波动,N>7换手率过高(超70倍),策略净收益呈负,因手续费损耗大。
- N较小(1~5),换手率控制在20倍内,收益稳定且较高。
- 特别是N=1时(即每日卖出买入1支),体现最佳收益率19.57%和信息比率1.74,同时换手率低至4.6,接近中长期换手水平。
- 最大回撤25.99%,回撤控制较好,显示风险管理改善。
  • TFT(50,1)策略表现详述(图表25-26,第22页)

- 收益及稳定性显著领先,超越传统加权多倍。
- 未来已知变量、模型多层次结构与变量筛选机制有效提升了策略稳健性。

总结:深度学习结合高维量化因子的时序模型,配合灵活调仓策略,能够实现在收益率、信息比率及风险控制上的显著提升,且换手率合理,适合实际投资管理。[page::18-23]

---

7. 综合结果与未来展望(第23页)


  • 整体总结

本文提供的TFT模型框架结合精选ALPHA360因子,成功建构出比传统ICIR方法表现优异的量化选股模型。通过灵活的TopKdropN调仓策略,将换手率控制合理,策略收益和风险优势更为显著。
  • 量化评估(图表27,第23页)

- CAGR从8.92%提升到19.57%,
- 超额收益显著增长,最大回撤略有下降,信息比率大幅提高(0.53提升至1.74),
- 换手率大幅下降,显示更加符合实盘交易要求和成本控制。
  • 未来工作:计划继续借助QLIB平台进一步探索不同时间序列Transformer模型,以及新型因子组合对股票市场的应用与提升。


---

三、图表深度解读



1. 市场表现图(第0页)


  • 图示“上证指数”(红线)、“国债指数”(蓝线)2016年6月至2017年5月表现,上证指数波动幅度大,市场整体呈上涨趋势,国债指数平稳,提供市场背景环境。[page::0]


2. QLIB框架图(第4页)


  • 展示QLIB三层架构(基础架构、量化流程、交互接口),清晰标明数据服务、模型训练及决策执行流程,为本研究面向的量化基础设施提供支持。

- 详述多层次决策链、执行子流程的模块划分,表明模型集成环境。[page::4]

3. 数据存储结构(第5页)


  • 数据的高效存储及时间序列压缩格式示意,保障海量历史因子计算与调用。

- 体现数据操作的高性能与实时更新能力,为训练深度模型提供基础。[page::5]

4. 因子算子与ALPHA因子示意(第6页)


  • 部分算子列举(加减乘除,均值、相关性等),清晰表达因子构建运算逻辑。

- ALPHA158与ALPHA360对比案例说明,两者因子生成机制差异,后者更侧重暴力组合。[page::6]

5. 因子表现分布图(第7页)


  • IC绝对值及IR分布箱线图表明,ALPHA360整体IC中位数较高且波动较小,且IR虽略低但表现均衡,体现其因子信息量丰富且稳定。

- 因子筛选表格具体罗列20个表现最佳的ALPHA360因子及其IC、IR,指导后续建模变量选择。[page::7]

6. Transformer模型结构图(第8页)


  • 详细展示经典Transformer编码器-解码器结构图,重点多头注意力及位置编码流程帮助理解深度学习网络架构原理和优势。

- 说明此架构对序列数据的强大表示能力。[page::8]

7. Transformer vs CNN性能对比(第9页)


  • 图表展示不同预训练数据量下Transformer模型与CNN表现,随着数据量提升,Transformer超越CNN,强调Transformer在海量数据条件下优势,对深度金融模型训练需求进行背景补充。

- 图示为ImageNet Top1指标[%]对训练样本数量关系曲线。[page::9]

8. 时间序列Transformer分类图(第10页)


  • 明晰分类细化了时间序列Transformer的架构调整方向及应用,方便技术交流及模型选择。[page::10]


9. TFT输入示意图(第11页)


  • 说明TFT分输入变量类别(静态、观测、已知未来)与不同时间维度数据承载模型,画面清晰表达未来信息通过模型贡献预测效果的机制。[page::11]


10. TFT模型结构详图(第11页)


  • 细化显示输入层、多层LSTM编码器-解码器、门控残差网络(GRN)、改良多头注意力模块整体架构,清晰链路体现模型如何动态权重变量与时间信息。

- 侧边块展示GRN网络与变量选择网络结构数学框架,为理解深度模型内部计算机制提供支撑。[page::11]

11. 训练误差曲线(第17页)


  • 训练集误差呈现快速下降趋势,10个epoch后趋于稳定,展示模型学习能力。

- 验证集误差低点出现在第2epoch后反弹,提示过拟合风险,与文中分析一致。[page::17]

12. 回测收益与风险图(第19、20、22页)


  • 策略净值、超额收益与回撤深度展示了模型策略的实证效果。

- 比较不同策略参数对应的换手率和年化收益分布柱状图,直观反映换手与收益的权衡。
  • TFT策略净值及指标全面优于传统加权组合,为深度学习模型带来的收益稳定提升提供视觉佐证。[page::19-22]


13. 主要绩效指标对比表(第19、20、22、23页)


  • 多组表格汇总策略年化收益CAGR、最大回撤MDD、超额收益Alpha、贝塔Beta、波动率StdDev、夏普比率与信息比率IR、换手率,定量评估模型表现。

- TFT(50,1)在收益、信息比率及换手率控制上均遥遥领先,显示其强大的实盘应用前景。[page::19-23]

---

四、估值分析



本报告聚焦于量化策略模型构建与回测展示,核心在于预测未来收益率及策略收益表现,不涉及传统企业估值模型(如DCF、PE、EV/EBITDA等)。因此,估值部分不适用。

---

五、风险因素评估


  • 报告风险提示明确指出所有结果均基于历史数据,不保证模型未来有效性,表明深度学习模型易受市场变动及黑天鹅事件影响。

- 过度依赖历史数据导致潜在的过拟合风险,训练中验证数据早期误差上升即反映。
  • 换手率提升带来的交易成本风险,模型参数调整重要影响策略实际表现。

- 因子有效性可能随市场结构变化而波动,外部环境变化(政策、宏观经济、监管)对模型适用性构成挑战。
  • 报告未详述特殊市场极端情况下模型稳健性测试及对冲措施。


总结:风险识别合理,但缓解措施及压力测试缺乏详细展开,需投资者关注模型长期泛化问题和实盘执行风险。

---

六、批判性视角与细微差别


  • 报告选用IC及IR指标进行因子筛选为合理但较传统方法,未充分考量非线性因子信息,限制深度模型潜力展现,本文对此已解释。

- TFT模型训练参数和结构虽详细,然而未提供多超参数调优细节及模型稳定性验证,结果对参数敏感性分析不足。
  • 训练样本覆盖时间至2015年,测试集回测时间2018–2021年,时间跨度有空档,数据更新连贯性及市场环境变化对模型长期适应性的影响需谨慎思考。

- 换手率与收益权衡充分分析,但流动性风险、市场冲击成本未量化描述,对模型转化为实盘应用的操作成本敏感性需要更多关注。
  • 模型性能对比显示TFT相对于部分传统模型并非最高,强调改进空间同时也提醒投资者模型结果非绝对,可视为持续优化方向。


---

七、结论性综合



本报告通过严密的因子筛选流程,利用微软QLIB平台提供标准化高质量数据和多模型框架,深入研究了基于Temporal Fusion Transformer的时间序列深度学习模型在中证500成份股未来收益率预测中的应用,实现了对传统ICIR因子加权方法的显著超越:
  • ALPHA360因子集合提供高质量、多维度的量价指标输入,筛选出20个表现优异因子,有效支撑模型提升。

- TFT结构利用LSTM编码替代传统位置编码增强时效性,门控残差网络与变量选择机制提升可解释性与非线性建模能力,分位数损失函数带来风险预测多样性。
  • 训练与验证显示,受限于股票市场低信噪比,模型在少轮训练即收敛,避免过拟合,训练效率合理。

- 实证回测中,TFT策略年化收益19.57%,信息比率1.74,换手率合理控制于4.6,最大回撤控制较好,远超传统ICIR加权策略(8.92%和0.53),展现强劲的风险收益优势。
  • 动态调仓策略的灵活参数优化有效平衡收益与交易成本,契合投资实操需求。

- 图表清晰呈现了模型结构细节、因子筛选逻辑和策略绩效,数据充分,论据严谨。

综合来看,本文不仅体现了深度学习技术对量化金融领域的推进作用,也展示了新兴模型结合高质量数据平台的应用潜力,为投资者和研究者提供了可参考的量化策略框架和方法论。

---

图片溯源示例


  • 市场表现图:

- QLIB框架图:
  • 因子IC分布图:

- Transformer结构图:
  • TFT模型结构图:

- 训练误差图:
  • ICIR加权策略净值图:

- TFT策略净值图:
  • TFT(50,1)净值图:


---

参考页码: [page::0,3-13,15-23]

报告