Stock Volume Forecasting with Advanced Information by Conditional Variational Auto-Encoder
创建于 更新于
摘要
本报告提出基于条件变分自编码器(CVAE)的非线性时序预测模型,利用股票重平衡日等先进信息提升欧洲50支股票日交易量的长期与短期预测精度。实证结果显示,CVAE模型相比传统线性模型(ARMA、VAR)在均方误差和交叉相关拟合上表现优越,且能生成情景分析帮助特征解释和决策支持。文中还探讨了非平稳时序的相关性估计及未来拓展方向 [page::0][page::1][page::3][page::4][page::5][page::6][page::7]
速读内容
- 引入基于CVAE的非线性时序建模方法,通过高级信息(如重平衡日指标)辅助股票交易量的长期与短期预测[page::0][page::1]
- CVAE架构设计包括编码器与解码器网络,隐藏变量服从高斯分布,采用迭代采样实现未来多步交易量的路径生成[page::1][page::2]
- 高级信息$X^0$定义为预测时已知的未来状态变量(如重平衡日),普通信息$X^1$为传统时序依赖变量(如前一日交易量),通过算法1和算法2迭代生成带高级信息的预测路径[page::2][page::3]
- 数据集涵盖欧元区50只高市值股票,数据来源Yahoo Finance,训练集2021-2022年,测试集2023年1-6月;处理包括归一化和高级信息编码(重平衡指标、地点、行业、周几)[page::3]
- 预测任务分为:长期预测(120个交易日)、短期滚动周预测(最长5天),对比模型包括U-CVAE、M-CVAE、ARMA(1,1)、VAR(1)[page::3][page::4]
- 模型性能指标评估包括均方误差(MSE)、相关性差异(CD)及交叉相关性差异(CCD),结果显示CVAE模型在长期和短期任务中的MSE显著优于线性基线,尤其是在短期滚动预测中表现突出[page::4][page::5]


| 模型 | mean MSE | median MSE | mean CD | median CD | mean CCD | median CCD |
|------------|----------|------------|---------|-----------|----------|------------|
| U-CVAE | 0.887 | 0.876 | 0.466 | 0.435 | 0.106 | 0.096 |
| M-CVAE | 0.888 | 0.884 | 0.391 | 0.374 | 0.146 | 0.136 |
| ARMA(1,1) | 0.923 | 0.922 | 0.441 | 0.421 | 0.755 | 0.837 |
| VAR(1) | 0.981 | 1.001 | 0.492 | 0.458 | 3.669 | 3.644 |
- CVAE模型能有效捕捉因重平衡日引发的交易量峰值,基于高级信息生成的情景分析展现了模型在非常规事件下的解释能力。

- 针对滞后交易量特征的解释显示,CVAE对异常冲击有良好响应,预测路径向长期均值回归,符合短期冲击的市场回归规律。

- 相关性评估揭示非平稳时序中平均路径相关性(CAP)和路径平均相关性(ACP)有显著差异,ACP在捕捉交叉相关性方面优于CAP,反映出CVAE模型对复杂非线性相关结构的拟合优势。

- 研究探讨了CVAE生成方案的多样化与模型架构可能的拓展方向,包括条件分布采样、区间预测、多维潜变量及卷积神经网络,以更好拟合非线性非平稳金融时序数据[page::6][page::7][page::8]
- 本文贡献总结:首次系统定义了含高级信息的时序预测问题,将CVAE纳入股票交易量时序预测,提升预测准确性,并支持多场景生成分析,丰富金融量化机器学习方法论和实务应用[page::1][page::7]
深度阅读
金融研究报告详尽分析报告
主题:《基于条件变分自编码器的高级信息股票成交量预测》
作者:Parley R Yang(剑桥大学数学系)、Alexander Y Shestopaloff(伦敦玛丽女王大学数学科学学院)
发布时间:2024年(具体日期未指明)
研究对象:股票成交量时间序列预测,尤其针对欧洲股市(Euro Stoxx 50指数成分股)
---
一、元数据与报告概览
该研究报告聚焦于利用条件变分自编码器(Conditional Variational Auto-Encoder,CVAE)模型,结合先进信息(Advanced Information),提升股票成交量时间序列在短期与长期的预测准确性。报告通过实证分析,展示CVAE模型在引入未来可知变量(如指数再平衡日)的非线性建模优势,能够生成拟合度更高且更贴近实际数据的非线性预测路径,并有助于多场景生成与解释。此外,报告还对非平稳时间序列中的相关性问题进行了理论和实验探讨。
报告核心信息:
- 主题明确:股票成交量预测与高级信息利用
- 核心贡献:提出CVAE建模框架引入非线性与先进信息,提升预测精度
- 研究方法:构建并训练CVAE,使用多变量与单变量模型对比传统线性模型(如ARMA、VAR)
- 关键结论:CVAE在MSE与交叉相关性等指标上优于传统模型,特别是长期预测显著提升
- 应用范围:覆盖Euro Stoxx 50指数50只股票的日成交量预测
- 主要输出形式:预测路径、场景模拟、相关性分析与模型解释能力展示。
---
二、逐节深度解读
1. 引言与动机(1.1节)
- 关键论点:
定义预测目标$Y{t+k|t}$为$t$时刻基于可用信息对$t+k$时刻变量的预测。传统线性时间序列依赖于过去数据(滞后项)并假设时间序列平稳,但现实中如股票成交量,存在非平稳性且受未来已知事件(如指数再平衡日)显著影响。
- 创新点:提出利用CVAE算法来非线性地融合该类"未来已知"的高级信息,提升预测性能。
- 核心假设:
- 传统线性模型的长期预测趋于无条件期望(平稳假设)
- 非平稳时间序列如成交量,则长期预测不一定收敛,这加大了预测和建模难度
- 高级信息定义及意义:
指已知未来某些时间点事件的发生,这些事件对预测变量有显著非线性影响。如股票指数再平衡时间点是未来时间的已知信息,能影响成交量。通过标记这些事件,CVAE可捕获其非线性影响。
---
2. 文献综述(1.2节)
- Neural Network在时间序列建模中的新进展:GANs、双向变分自编码器等。
- 本文创新点为结合高级信息引入CVAE模型,并强调生成式能力(Scenario Generation)和模型可解释性。
- 先进信息的类似概念在贝叶斯时间序列中出现,但未明确命名或深度利用。
- 成交量预测的动机来自金融衍生品定价及市场微观结构文献,强调对真实复杂市场行为的准确建模需求。
---
3. 方法论(第2章)
3.1 CVAE模型框架(2.1节)
- 模型设定:
- 输入变量$X\in \mathbb{R}^p$,预测变量$Y\in \mathbb{R}^d$,潜变量$Z\in \mathbb{R}^q$(正态分布)。
- 条件分布$Y|X,Z$服从均值为$f(X,Z)$、协方差$\sigma^2 Id$的多元高斯。
- 潜变量后验$Z|X,Y$服从均值$\mu(X,Y)$,协方差$\Sigma(X,Y)$的对角高斯。
- CVAE核心结构:编码器$\hat{f}^{en}$估计潜变量分布参数,解码器$\hat{f}^{de}$生成预测分布。
- 时间序列建模:通过迭代预报策略,即每步用上一时刻预测输出作为下一时刻模型输入,实现多步滚动预测。
3.2 生成预测算法(2.2节)
- 通过从潜空间采样多个$Zs$,生成多条预测路径,计算样本均值作为最终期望预测。
- 预测路径定义及其统计量表述清晰,支持多场景解释。
3.3 高级信息定义与使用(2.3节)
- 区分两类信息:
- 先进信息$X^0$(提前已知,如未来事件的指标)
- 普通信息$X^1$(仅当前时刻已知,如滞后变量)
- 形成过滤器$\mathcal{F}t^* = \mathcal{F}{t+K}^0 \times \mathcal{F}t^1$,融合未来信息影响概率分布。
- 高级信息可是类别指标(如面板数据的分组、季节性)或再平衡日指标,甚至类似协整中的趋势成分。
3.4 预测算法详述(2.4节)
- 算法1为一般先进信息的多步预测实现,每一步利用先进信息和前一步预测结果迭代生成样本。
- 算法2为结合一阶自回归普通信息的简化版本,适用于实证,明确如何引入滞后值变量,具体执行细节完备。
---
4. 实证应用:Euro Stoxx 50股票日成交量预测(第3章)
4.1 数据处理(3.1节)
- 50只2023年末组成的Euro Stoxx 50成分股,时间区间训练集:2021年初-2022年末,测试集2023年上半年。
- 数据预处理包括标准化(均值方差归一化),并使用再平衡日($RB_t$)事件及股票类型(地区、行业)作为高级信息,后者不随时间变化。
- 图1展示两个典型股票数据的原始与处理后数据,特别标注再平衡日期,观察明显成交量峰值往往与再平衡日重合。
4.2 预测任务说明(3.2节)
- 长期预测:固定$t$(训练集末尾),预测未来$K=120$个交易日(2023年上半年)成交量。
- 短期滚动预测:以多时间点,多步滚动方式,预测未来一周内(日)成交量,$K \leq 5$。
4.3 模型总结(3.3节)
- 单变量CVAE(U-CVAE):每只股票单独建模,$q=1$潜空间维度;输入包含高级信息和滞后成交量。
- 多变量CVAE(M-CVAE):整体50维量同时建模,捕捉跨股票联动性,简化高级信息只包含日期和再平衡信息。
- 基线模型:对应单变量用ARMA(1,1),多变量用VAR(1)。
4.4 评估指标(3.4节)
- MSE:均方误差,衡量预测与真实值误差。
- CD:相关矩阵差异度量,衡量预测与真实成交量在股票间相关性的误差。
- CCD:跨时刻交叉相关差异,关注预测路径中滞后相关性的拟合质量。
4.5 预测表现总结(3.5节)
- 表1和表2呈现长短期预测各模型的主要统计指标。
- CVAE模型在MSE上明显优于传统线性模型,尤以短期滚动预测表现突出。
- CVAE在CCD指标上也显著优于传统模型,表明其对时间结构和非线性动态的把握更精准。
- 线性模型在CD指标表现更好,意味着其更稳定地维持了相关结构,但可能在精度和预测尖峰捕捉方面不足。
- 图2和图3直观展示多只标的股票的预测对比,CVAE预测能捕捉成交量尖峰波动及非线性行为,而ARMA和VAR则趋于平稳。
- 图4的局部放大分析进一步展示CVAE拟合再平衡日导致的体积峰值的优势。
---
5. 生成器解码器的解释性和情景分析(3.6节)
- 针对再平衡(RB)变量影响:
利用U-CVAE生成的多个路径,分别对照含有再平衡事件与无再平衡事件的反事实(counterfactual)情景。
- 图5显示再平衡事件周围成交量预测的分布,明显可见再平衡日当天预测均值与上下分位显著提升。
- BNP股票短期滚动预测(图6-7)通过制造不同初始滞后成交量值的反事实情景,实现类似IRF(冲击响应函数)分析,验证模型对极端成交量冲击的非线性响应与逐步回归稳定的行为。
---
6. 进一步讨论:非平稳时间序列路径相关性(第4章)
- 区分了两种相关性指标:
- CAP(Correlation of Average Paths):基于平均预测路径计算相关性
- ACP(Average of Correlation of Paths):先分别计算单条预测路径的相关性,再取平均
- 图8实证展示两种方法的差异,ACP拟合实际数据相关性较好,更适合捕捉时序依赖关系,CAP则通常出现偏差。
- 讨论非平稳时间序列中相关性极限分布困难,传统线性模型下因平稳会收敛预测无伴随误差,但现实中成交量非平稳,导致ACP与CAP统计量表现差异。
- 进一步提出CVAE生成方式的变体,即潜变量$Z$可条件采样于历史观测,而非独立正态,尚待深入研究。
- 讨论扩展到区间预测、多层神经网络架构(卷积网络等)和不同潜变量维度等未来可能的技术方向。
---
7. 结论(第5章)
- 明确提出预测带先进信息的时间序列问题分类,涵盖面广泛。
- 利用CVAE模型实现对这一问题的非线性建模与生成式预测。
- 实证表明CVAE优于经典线性模型,尤其在捕捉非线性波动和时序结构方面能力突出。
- 通过生成多场景模拟,实现了对关键特征(如再平衡日、滞后成交量)的定量解释,提升了模型的实践价值及解释力。
- 对未来研究提出展望,结合高级信息实现更复杂非线性时间序列建模。
---
三、图表深度解读
图1:股票ASML.AS与BNP.PA原始及标准化成交量数据及再平衡日标注
- 上三行呈现两只股票从2021至2023年中日成交量的原始值与标准化后数据。
- 纵轴单位:成交量(原始为绝对数字,标准化后均为零均值单位方差)。
- 标红垂直线为再平衡日,明显伴随成交量峰值。表明RB日为预测中的关键事件,非线性影响显著。
- 数据质量控制体现为缺失值剔除,保证模型训练与测试稳定。
---
图2:短期滚动预测示例(M-CVAE与VAR(1))
- 多个欧洲股票日常成交量的标准化数据(蓝色交叉点),与M-CVAE预测(橙色)和VAR(1)预测(绿色)对比。
- 视觉上CVAE能较好捕捉成交量的峰值,且预测曲线更贴合真实数据波动。
- 线性VAR模型预测趋于平滑,未能反映大多数峰值的显著波动。
- 说明模型在短期刻画非线性动态和异常事件方面的优越性。
---
图3:长期预测示例(U-CVAE与ARMA(1,1))
- 采用单变量CVAE和ARMA对若干股票的长期成交量走势(半年度)进行比较。
- CVAE预测能够生成明显波峰,与真实数据尖峰更匹配。
- ARMA预测曲线平稳且常忽略异常事件。
- 强调CVAE在长期非平稳预测中的优势,尤其事件驱动的成交量异常捕捉。
---
表1与表2:长期与短期预测性能统计指标
| 指标 | U-CVAE | M-CVAE | ARMA(1,1) | VAR(1) |
|------------|--------|--------|-----------|--------|
| 长期均方误差 | 0.887 | 0.888 | 0.923 | 0.981 |
| 长期平均CD | 0.466 | 0.391 | 0.441 | 0.492 |
| 长期平均CCD | 0.106 | 0.146 | 0.755 | 3.669 |
| 短期均方误差 | 0.793 | 0.788 | 0.971 | 1.07 |
| 短期平均CD | 0.24 | 0.275 | 0.093 | 0.193 |
| 短期平均CCD | 0.124 | 0.262 | 0.377 | 0.42 |
- MSE指标显示CVAE在误差控制上整体优于线性模型(尤其短期预测提升明显)。
- CD指标在短期线性模型表现较好(表明相关结构保留较好),但CVAE多表现中等偏好,可能因其更自由拟合带来一定过拟合波动。
- CCD指标中,CVAE优势十分明显,证明其在时序相关性建模上远胜线性基线。
---
图4:ASML.AS长期预测局部放大对比
- 在2023年3月至4月内,U-CVAE和M-CVAE预测成功捕捉再平衡日成交量高峰,而ARMA和VAR预测趋于常态平均水平。
- 说明高级信息对异常时点交易量的有效增强作用。
---
图5:再平衡事件影响的反事实场景(ASML)
- 左图为包含实际再平衡事件的预测路径(多条灰线示意不同采样路径),红线为均值曲线,蓝黑为上、下2.5%分位数。
- 右图为假设无再平衡日情景的预测路径,整体均值和分位数较低,峰值显著减弱。
- 说明模型成功捕捉并量化了再平衡日对成交量的非线性激励效应。
---
图6-7:短期滚动预测及滞后量动因的反事实分析(BNP.PA)
- 图6展示短期预测能捕捉实际成交量异常波动,包括3月24日银行业压力引发的成交量增高。
- 通过替换滞后变元进入CVAE预测,生成的反事实路径显示成交量冲击后的逐步恢复趋势,符合传统冲击响应分析。
---
图8:非平稳时间序列中两种相关性估计方法的对比
- ACP(平均路径相关)和CAP(路径平均相关)统计量在短期预测中重新估计多次,表现出明显差异。
- 图示中,ACP曲线更接近真实相关性值,CAP则存在偏差,尤其在非平稳波动模型中会误判相关结构。
- 指出CVAE模型的相关性统计需谨慎选取度量以反映真实动态。
---
图9-10:长短期预测的相关性矩阵热力图
- 图9对比实际数据相关性矩阵、U-CVAE生成的相关性矩阵和ARMA预测矩阵。
- CVAE相关性矩阵更贴近实际,尤其交叉相关矩阵,ARMA表现不佳。
- 图10进一步展示ACP与CAP的差别,确认ACP的优越性。
---
四、估值分析
报告非传统金融资产估值报告,故无DCF等估值模型解析。主要应用机器学习预测模型,重心是预测精度提升与时序结构拟合。
核心模型假设与参数选择包括:
- 潜变量维度$q=1$简化模型结构,平衡效果与复杂度。
- 训练中通过最大化变分下界(Variational Lower Bound),结合重参数技巧优化。
- 调参中不同$\sigma$值用于预测精度与场景模拟的平衡。
---
五、风险因素评估
报告未专门列示风险章节,但隐含风险包括:
- 模型假设风险:CVAE模型基于高斯分布假定和潜变量独立性,实际市场数据可能存在偏离。
- 非平稳与突发事件风险:尽管纳入先进信息,但市场极端事件复杂难捕捉,对预测的鲁棒性存挑战。
- 过拟合风险:部分指标上CVAE模型表现出过拟合迹象,可能影响泛化能力。
- 数据质量风险:缺失数据剔除可能影响部分股票的连续性及结果稳健性。
报告通过多任务、多指标交叉验证及场景模拟部分缓解上述风险,但未明确给出风险概率或缓解策略。
---
六、批判性视角与细微差别
- 报告观点客观,详细解释模型学习机制及优势,并与传统模型全面对比。
- 可能存在对高级信息的过度依赖,在某些极端无明显先进信息影响时预测能力有限。
- 相关性指标(特别是CAP与ACP的选择)未能在全部场景一致优越,提示对指标诠释需谨慎。
- 实证仅限Euro Stoxx 50,股票样本可能存在行业、区域集中风险,降低模型在其他市场的直接应用性。
- 潜变量仅用$q=1$简化,虽保留计算复杂度,但限制了模型拟合能力,未深入探讨多维潜空间空间表现。
- 算法迭代生成会带来误差累积,但实际效果在报告中未深入量化。
---
七、结论性综合
本文系统地介绍并实证验证了利用条件变分自编码器(CVAE)在引入高级信息(如未来已知的再平衡日、板块与地区分类指标)情境下,预测股票成交量的有效手段。通过设计包含先进信息与传统滞后信息的混合输入,CVAE能够生成高度非线性、趋势变化敏感的预测路径。实证分析覆盖Euro Stoxx 50指数的50只股票,长短期预测均展现较传统ARMA和VAR模型显著的误差下降和交叉时序相关性改进。
高级信息如再平衡日的引入,使得模型对关键事件驱动的成交量峰值有准确而具有解释力的再现能力。生成路径样本的多场景分析支持对模型输入特征的定量解释,有助于金融衍生品如股票回购合同的定价及风险管理。非平稳时间序列的复杂相关结构亦得到了理论和实证的深入探讨,提出ACP作为更合适的相关性估计指标。
整体而言,该研究通过结合最新深度生成模型技术与先进金融领域洞察,提升了股票成交量预测的精度与实际应用价值,为非线性金融时间序列建模提供了重要方法论参考和实务工具。
---
附图例
图1 股票成交量及再平衡日示意
-

图3 长期预测对比示意
-

图5 再平衡事件反事实路径
-

图7 滞后成交量反事实路径
-

图9 相关矩阵热力图
-

---
参考来源
所有论点和数据均严格基于报告正文及附录,引用对应页码为:
[page::0,1,2,3,4,5,6,7,8,9,10]