DELPHYNE: A PRE-TRAINED MODEL FOR GENERAL AND FINANCIAL TIME SERIES
创建于 更新于
摘要
本论文提出Delphyne,首个针对通用与金融领域时间序列任务均表现优异的预训练模型,针对时间序列跨领域负迁移问题设计了一系列架构改进,并实证展示了其在多维度金融预测、概率量化及异常检测任务中的领先性能。[page::0][page::1][page::3][page::5][page::6][page::7][page::9][page::10]
速读内容
负迁移效应揭示与对策 [page::1][page::2][page::3]

- 预训练阶段跨领域数据差异导致模型零样本性能显著降低,如GARCH与Wavelet混合训练模型表现较单一源模型差。
- 通过贝叶斯MCMC分析,深入验证负迁移现象独立于模型结构,主要表现为难以准确拟合数据后验分布。
- 融入金融数据的Delphyne模型(Delphyne-A)零样本预测同样受负迁移影响,但微调阶段能快速消解该效应,达到与非金融预训练模型相近的表现。
模型架构与训练策略 [page::3][page::4][page::5]

- 使用基于Transformer编码器的any-variate注意力机制,结合缺失值与预测掩码处理多频率、多变量、缺失数据等挑战。
- 利用学生t分布混合模型进行概率分布建模,表现优于单一分布,且架构集成门控线性单元和旋转时序编码提升表达能力。
- 预训练涵盖LOTSA大规模公开数据集与自建金融数据(占训练样本15%),并通过贝塔二项分布控制变变量数与掩码比例,优化上下文长度达到最佳微调效果。
量化实证及性能评估 [page::5][page::6][page::7][page::8][page::9][page::10]
| 任务 | 指标 | Delphyne-A ZS | Delphyne-A FT | 对比最佳 |
|------|------|---------------|---------------|----------|
| 股票风险分析(NLL) | NLL | 1.762 | 1.741±0.002 | 优于MOIRAI、GARCH |
| 股票风险分析(方差预测) | MSE | 37.792 | 37.810±0.105 | 最优性能 |
| 5分钟条形数据 log-volume预测 | MSE | 0.728 | 0.551±0.017 | 领先MOIRAI及其他基线 |
| 公司销售增长现值预测 | MAE | 0.099 | 0.071±0.002 | 优于MOIRAI和统计基线 |

- 零样本模型表现优异,微调后性能显著提升,特别是在金融长序列及多域数据下优势明显。
- 多变量相关性建模实验显示any-variate注意力优于通道混合及独立方法,能灵活适配强弱相关金融数据。
- 量化指标稳定,Delphyne在概率量化(CRPS、MSIS)及异常检测任务上均实证其广泛适用性,故具备金融领域实战价值。
量化策略与因子构建(预训练模型与微调框架) [page::3][page::4][page::5][page::27]
- Delphyne作为预训练时间序列模型着重在于利用少量微调样本快速适配下游任务的能力,减轻负迁移影响。
- 结合any-variate attention和学生t分布混合,其架构适合捕获多重频率、多个变量间复杂交互。
- 实证结果表明微调样本量越大,性能越优,且长上下文预训练有利于微调效果提升。
- 掩码比例实验支持采用较低掩码率(30%左右)以强化模型对长序列信息的感知。
- 该模型兼具通用时间序列能力与金融特定任务深度适配,具有较强泛化和迁移能力。
深度阅读
深度解构与分析报告:《DELPHYNE: A PRE-TRAINED MODEL FOR GENERAL AND FINANCIAL TIME SERIES》
---
1. 元数据与概览
- 标题:DELPHYNE: A PRE-TRAINED MODEL FOR GENERAL AND FINANCIAL TIME SERIES
- 作者:Xueying Ding (Carnegie Mellon University)、Aakriti Mittal (Bloomberg)、Achintya Gopal (Bloomberg)
- 发布机构:Carnegie Mellon University与Bloomberg合作,最新研究成果
- 日期:2024年,具体发表年份未直接披露(结合引用文献多为2023-2024年),推测为2024年
- 研究主题:提出名为Delphyne的时间序列预训练模型,聚焦于金融领域和一般时间序列预测任务,解决现有预训练模型在金融时序任务零样本和微调性能不足的问题
核心论点:
- 现有时间序列预训练模型在金融领域表现未达到预期,主要因预训练阶段缺乏金融数据及跨领域时序数据模式差异导致负迁移(negative transfer)现象
- "负迁移"是不同领域数据混合训练导致模型对目标任务表现下降的关键问题,尤其是在时间序列连续性、噪声及多频率采样的挑战下
- Delphyne通过融合大规模公共数据集(LOTSA)和金融数据,设计任何维度关注机制、多频率适应机制、基于Student’s T分布混合的概率预测输出,并依赖微调以缓解负迁移
- 实验表明Delphyne在多领域时间序列任务及金融风险分析、波动率建模、成交量预测及收益现报等多种金融任务上超越或持平最新基线
---
2. 逐节深度解读
2.1 引言(Sections 0-1)
- 时间序列是金融领域应用的关键数据类型,传统统计模型(ARIMA、GARCH、VAR)及近年深度学习方法均未充分解决跨领域预训练难题
- 大模型如LLMs虽引发兴趣,但直接用于金融时序表现有限,主要聚焦趋势预测,缺乏实用性和收益风险建模深度
- 预训练领域缺金融样本;跨领域混合训练产生的负迁移严重制约性能,此外,金融时序数据的多频率、多变量、缺失数据等特性增加了建模难度
- 关键创新:Delphyne引入了any-variate attention机制,有效处理任意数目且频率不同的变量,配合missing & forecast masking避免缺失数据扰动预测
- 输出采用Student-T分布混合,适合金融数据的厚尾特性,达到了与更复杂混合分布方案相当的性能,保持模型简洁性
- 重点强调微调(fine-tuning)是克服负迁移的关键策略,模型快速“去偏”并适应新任务,在少量样本下即可取得优势,体现预训练模型的实际价值 [page::0,1]
2.2 负迁移效应详解(Section 2)
- 负迁移定义为预训练中学得的知识对下游任务产生负面影响。论文通过合成数据(Wavelet和GARCH两类时间序列)展开验证
- 分别训练三模型:只用Wavelet数据(W-Model)、只用GARCH(G-Model)和混合数据(M-Model),结果显示混合模型零样本负对数似然(NLL)明显劣于单独训练模型,揭示了负迁移影响
- Bayesian MCMC视角进一步论证负迁移的本质,在具体贝叶斯后验估计中,混合模型难以同时准确拟合两种截然不同的数据生成机制,导致性能下降
- 在Delphyne自身预训练中,包含金融数据的模型(Delphyne-A)零样本性能劣于不包含金融数据的版本(Delphyne-L),但微调后性能趋同,体现微调对负迁移的极佳矫正作用
- 提出预训练模型应强调“快速适应性”而非零样本能力,使其能在少量目标数据下迅速“去偏”和调整,最大化实用价值 [page::1,2,3]
2.3 模型架构及设计(Section 3)
- Delphyne采用transformer编码器框架,结合any-variate attention机制以捕捉多变量间复杂相关性(同时支持强相关和弱相关数据)
- 处理多频率和缺失数据的关键机制包括 missing mask和 forecast mask,mask在patching之前应用,允许模型区分缺失和待预测项,减少数据扰动
- 通过将多变量展平成一维序列并独立对各变量进行实例归一化(Instance Normalization),支持变数量级和可变维度序列
- 引入旋转时间嵌入(rotary time embedding)增强时序长距离依赖的表示能力
- 实验表明预训练时长上下文(context length)和遮掩比例(masking ratio)对微调表现有显著影响,具体如下:
- 上下文长度为32在零样本NLL最好,但128上下文长度有利于少样本下的微调优化
- 遮掩比例较小(约25%-30%)提升微调性能,过高遮掩率(99%)损害模型泛化
- any-variate attention在相关变量上优于通道混合,而在非相关数据上避免过度混合带来负面效应,符合金融多变量复杂的内在相关结构
- 输出层使用Student-T混合分布,简单稳定且符合金融数据厚尾特征,验证中性能与更复杂混合模型相当,兼顾效率与表达力 [page::3,4,5,6]
2.4 训练数据与参数设置(Section 4)
- 训练数据包括:
- 公共数据集LOTSA(占85%):涵盖能源、交通、气候、云运维、销售、经济、金融、医疗等多领域
- 金融数据(占15%):股票、ETF、商品、外汇、公司财报及高频交易条数据
- 鉴于数据极度不平衡,通过采样权重调整避免过度拟合大规模领域数据
- 训练时采取简单高效的预处理:无复杂包装或拼接,仅采样和时间截断(最长512×32步)
- 模型参数:12层transformer编码器,768维attention,12个attention头,ffn最大维3072,dropout 0.2
- 优化器为AdamW(学习率1e-4,权重衰减0.1),训练1百万步,使用学习率warmup和cosine退火,训练环境为8张NVIDIA H100 GPU,混合精度bf16
- 训练的精心设计保障了模型对多频率、缺失和长上下文时间序列的处理能力,适应不同任务需求 [page::6,7]
2.5 实验与性能分析(Section 5)
金融任务
- 股票回报方差(波动率)及分布预测,通过NLL和MSE指标评估
- Delphyne-F(纯金融数据预训练)在零样本表现最好,Delphyne-A(综合数据预训练)在微调后表现最佳
- 说明综合预训练提升了模型的泛化和微调适应能力,验证了微调抵消负迁移效果的假设
- 对比经典金融基线(如GARCH+Student’s T)及最新模型MOIRAI,Delphyne表现优异
- 成交量条数据(五分钟粒度)预测,Delphyne显著优于大部分基线,且微调效果明显提升准度
- 公司销售额增长的期现报(nowcasting)任务,Delphyne-A微调后超越基线,体现对高频、多粒度的金融经济数据适应性强
一般时间序列
- Monash数据集短期时序预测,Delphyne在零样本中表现优于Naive基线及其他模型,且微调后与顶级MOIRAI旗鼓相当
- 长期外分布预测(ETT、天气、电力数据),Delphyne在零样本落后于部分基线,但微调后显著提升,说明设计架构对适应长序列和复杂分布的效用
- 混合数据预训练版本Delphyne-A在带有金融波动性季节性的数据集表现优于无金融数据的Delphyne-L,表明共享季节性特征的领域有益于降低负迁移发生
概率定量与异常检测
- 概率预测指标CRPS、MSIS评测显示Delphyne经微调后在多领域中表现优越,特别是MSIS指标(覆盖性)反映了其使用Student’s T混合分布优势
- 异常检测任务中,Delphyne微调后以F1分数排名第二,显示其多任务适应能力和概率建模有效性
可视化
- 通过多幅图表展示了模型在ETT、股票回报、公司销售增长及交易条数据上的预测区间和未来路径,直观体现Delphyne对不确定性的合理建模与精准微调适应能力
- 与MOMENT、TTM等比较图像进一步印证Delphyne在细节捕捉和预测稳健性上的竞争优势 [page::7,8,9,10,29,30,31,32]
---
3. 图表深度解读
图1 (Page 2) — 合成数据对比:Wavelet与GARCH样本示例
- 展示两类合成时间序列,左为规则的波动函数(振荡形态),右为金融领域经典的随时间变化的波动率聚类数据
- 该对比突出两种截然不同数据生成机制下,模型负迁移问题的根源在于数据生成机制和统计特性差异
表1 (Page 2) — 不同训练数据模型零样本负对数似然(NLL)
- G-Model对GARCH数据表现优(0.0865),W-Model对Wavelet数据表现优(-0.1020),M-Model混合数据训练两边均差(NLL增高)
- 明显量化负迁移,混合训练导致模型泛化性和拟合度下降,验证单域训练优秀但跨域难迁移
表2 (Page 2) — Bayesian MCMC方法下波形和混合模型MSE与NLL
- 进一步理论支持负迁移,混合模型MSE和NLL均高于单一Wavelet模型,说明混合模型难以准确拟合真实数据分布
图2 (Page 3) — Delphyne MAE随训练步数及模型版本的变化
- 包含金融数据的预训练(Delphyne-A)在零样本时MAE高于不含金融的版本(Delphyne-L),但通过微调,两个版本MAE趋同且明显下降
- 说明微调有效“纠正”负迁移带来的偏差,强化泛化性能
图3 (Page 4) — Delphyne整体架构流程示意图
- 输入为多变量时间序列,经过缺失/预测掩码处理后分片patching,嵌入编码,任意变量注意力机制用于捕捉多维交互
- 输出为学生T分布混合,实现概率预测
- 该设计平衡了多变量复杂结构、多频率缺失数据、多样时间步长及长上下文依赖需求
表3-5 & 表4 (Page 5) — 预训练上下文长度及遮掩比例、不同多变量建模架构的零样本与微调性能
- 上下文长度32最优零样本,较长上下文64/128促成更好微调效果,体现长记忆对微调优势
- 遮掩浓度较低保持信息完整性,利于性能稳定
- 任意变量注意力对相关变量集成优势明显,大幅优于无相关性时的通道混合体现适度信息整合必要
图4 (Page 6) — 三种输出分布在股票NLL上的表现
- Mixture Student’s T与更复杂的MOIRAI混合分布持平,单一分布逊色明显
- 支持简洁但有效的学生T混合选择,增强稳健性与建模厚尾金融数据特性
表6 (Page 6) — 训练数据采样权重分布
- 公共数据集占85%,涉及能源、运输、云运维等;金融数据占15%但覆盖股票、ETF、商品、货币等多样样本
- 表示训练数据均衡性策略,有效规避数据量差异导致模型偏好大领域数据影响
表7-10 (Page 7) — 各金融任务的评估指标(NLL、MSE、MAE)
- 股票风险分析中Delphyne-F零样本表现最优,微调后Delphyne-A领先
- 成交量条数据由Delphyne预训练模型微调后的MSE明显改善
- 公司销售增长预测中Delphyne-A微调后表现优,验证其对多频率经济数据的适应力
图5-6 (Page 8) — Monash数据集零样本及微调的MAE几何平均性能
- 零样本下Delphyne-F略优Naive,其余模型表现略低,金融数据单独预训练适合相似领域
- 微调后Delphyne-A与Delphyne-L性能接近,整体与MOIRAI顶尖模型错误率接近
表11 (Page 9) — 长期预报零样本/微调与线性微调对比
- Delphyne-A在微调后相较零样本取得明显进步,验证架构和训练策略的适应性
- 微调是大幅提升out-of-distribution任务表现的关键
表12 & 图7 (Page 9-10) — 概率预测及异常检测评估
- Delphyne-A经微调后CRPS和MSIS指标优于竞争方法,尤其在置信区间覆盖评估(MSIS)中优势显著
- 异常检测F1得分达第二名,表明其泛化到异常场景的能力
---
4. 估值分析
本研究未直接涉及传统意义上的企业估值,而是以性能指标(NLL、MSE、MAE、CRPS、MSIS、F1)衡量模型预测与概率输出质量。使用的评估指标均已在上下文中详细解释,符合金融时间序列风险分析和预报模型的通行标准。
---
5. 风险因素评估
报告识别了预训练财务时间序列模型主要风险:
- 负迁移效应:跨领域时间序列数据的相互干扰导致零样本性能恶化,是预训练模型应用于金融领域的主要挑战
- 数据特性差异:多频率、不规则采样和高噪声导致的建模复杂度增加
- 微调依赖:减轻负迁移的唯一有效手段,微调不足或数据有限时模型性能可能受限
- 模型假设的限制:输出分布采用Student’s T混合简单化处理,虽然稳健但仍可能无法完全拟合所有金融时序复杂特性
- 数据反映时效性:预训练数据截止2019年,最新金融事件未完全涵盖,可能影响实战意义
报告对风险提供了机制缓解策略,主要依赖于微调和架构设计,并未量化风险发生概率,但通过实验证明效果良好。
---
6. 批判性视角与细微差别
- 报告强调微调能力是Pre-trained时序模型优势,但实际应用中微调的成本和数据需求具有不确定性,可能限制部署环境
- 负迁移效应虽强调但尚无根治方案,仅通过微调“纠偏”存在被动调整的风险,难以根本避免
- 预训练数据虽然包含金融数据,但仅占15%,说明模型在金融领域数据的比例不足,长期泛化仍有待检验
- 表现上Delphyne在零样本多次任务低于其他模型,反映出基础模型通用能力仍有提升空间
- 报告对复杂输出分布的权衡合理,但仍可能牺牲部分对极端金融行为的捕获
- 视觉图表部分考虑较少对异常值的展现和解释,且个别表格数据存在排版和格式错落,阅读体验稍受影响
---
7. 结论性综合
《DELPHYNE》报告全面探讨了基于Transformer的预训练时序模型在跨领域金融任务中的应用挑战,尤其聚焦负迁移效应,对比传统及现有深度模型的不足。Delphyne通过融合同步预训练金融和公共数据集、采用any-variate attention机制、多频率缺失区分掩码设计、采用Student’s T混合分布概率输出,并重度依赖微调策略,实现了在金融风险分析、波动率建模、成交量预测、公司收益nowcasting等多关键金融应用中表现领先或匹配最新基线,同时保持一般时间序列任务的强大泛化能力。
关键技术或创新点包括:
- 负迁移效应的严谨论证与应对:论文通过多种实验和贝叶斯推断模型揭示跨领域混合训练导致性能下降的本质,强调微调为主要解药
- any-variate attention机制:有效融合多变量多频率数据,既可处理变量间强相关性,也避免不相关数据带来噪声
- Masking机制创新:缺失数据与预测目标独立掩码,有效解决多频率及数据不完整问题
- 概率输出设计:学生T混合分布平衡模型表现与复杂度,适应金融数据厚尾特点
- 丰富的评测体系:从零样本、微调、概率预测、异常检测和多任务烟囱式验证模型,保证实验结果的全面可靠
图表中如零样本与微调性能对比图(见图2)、合成数据模型性能表(表1、2), 预训练设计敏感性分析(表3-5), 金融任务指标对比(表7-10), 多域整体性能汇总(表11-12)以及视觉化预测示例图(图8-14)均支撑了论文主张——Delphyne是首个在金融及通用时序任务中均表现优异的预训练模型。
综上,Delphyne代表了金融时序大模型领域对预训练技术的突破,揭示了金融时序预测模型设计的关键难点及有效解决路径。其细致的任务设计与大量实验,可为金融AI模型开发提供范式与理论支撑,是金融与时间序列机器学习领域的重要里程碑成果。[page::0,1,2,3,4,5,6,7,8,9,10,29,30,31,32]
---
附件:核心图表示例 Markdown 格式展示
- 图1:Wavelet与GARCH示例

- 图2:Delphyne MAE训练曲线

- 图3:Delphyne架构示意

- 图4:不同输出分布股票NLL对比

- 图5-6:Monash零样本及微调结果


- 图7:异常检测F1综合评分

- 图8-14:预测结果各种场景可视化
见报告末页及附录,具体见页码29-32
---
以上即对《DELPHYNE: A PRE-TRAINED MODEL FOR GENERAL AND FINANCIAL TIME SERIES》研报的全面详尽分析解读。