`

Stockformer: A Price-Volume Factor Stock Selection Model Based on Wavelet Transform and Multi-Task Self-Attention Networks

创建于 更新于

摘要

本报告提出了Stockformer模型,结合离散小波变换、双频时空编码器、多任务自注意力机制和图嵌入技术,精准捕捉股票市场的短期波动与长期趋势。通过360维价格-成交量因子输入和TopK-Dropout策略,在多阶段市场行情中回测表现优异,显著超越主流基线模型,展示了极佳的预测稳定性和适应性[page::0][page::8][page::26][page::42]

速读内容

  • Stockformer模型架构核心包括:离散小波变换分离高低频信号、双频时空编码器捕捉时序空间依赖、融合注意力解码器进行趋势和收益率的联合预测以及多任务学习策略[page::8][page::14]。

  • 利用时隙与Struc2Vec图注意力网络对时间及股票空间关系建模,捕捉行业和市场结构复杂依赖,增强模型对市场动态的感知力[page::12][page::13]。

  • 构建了包含360个价格-成交量因子的多维输入特征,利用中证300成分股历史价格及成交量数据,滚动窗口划分14个子集进行训练与测试,保证模型的时序泛化能力[page::16][page::17][page::18]。

  • Stockformer在十四个子集上预测表现优异,IC平均值0.0294,方向准确率达57.46%,均显著优于包括XGBoost、LSTM、Transformer等在内的10个基线模型[page::26][page::27]。


| 模型 | IC↑ | Rank IC↑ | ICIR↑ | Rank ICIR↑ | 方向准确率(%)↑ |
|------------|--------|----------|---------|------------|----------------|
| Stockformer| 0.0294 | 0.0344 | 0.1921 | 0.2669 | 57.46 |
| ALSTM | 0.0124 | 0.0081 | 0.0952 | 0.0603 | 52.85 |
| LightGBM | -0.0070| -0.0202 | -0.0531 | -0.1572 | 54.11 |
  • 消融实验强调模型关键组件的重要性:去除小波变换层、时序卷积与注意力、图嵌入或融合注意力均导致性能显著下滑;多任务监督策略提升模型泛化能力和预测准确率[page::28][page::29]。
  • 超参数灵敏度分析显示:隐藏层尺寸128、2层编码器、批次大小16以及分类损失权重2.0为最佳配置,实现IC和ICIR的最优提升[page::30]。

  • Backtesting阶段,采用TopK-Dropout选股策略,并在不同市场环境下对比分类概率输出与回归预测输出,发现通常高置信度时优先采用分类输出,反之则回归输出更优[page::31][page::32]。
  • TopK-Dropout策略示意图及运行机制:


持续持有最高分TopK个股票,丢弃次低的Drop个股票,动态调仓;
  • 不同市场行情回测结果:


1. 牛市(2020-11至2021-01):Stockformer分类输出年化收益239.73%,仅次于LightGBM;最大回撤3.07%最低,Sharpe比率8.46表现优异[page::35][page::36]。


2. 熊市(2022-01至2022-05):Stockformer年化收益-15.18%亏损最小,第二低波动率31.04%,表明模型抗风险能力强[page::37][page::38]。


3. 震荡市(2023-05至2023-08):Stockformer实现44.48%正年化收益,波动率15.68%,最大回撤仅4.14%,Sharpe比率2.71领先所有基线[page::39][page::40]。

  • Stockformer通过14个回测子周期验证成果,大多数周期超越CSI 300基准,尤其在风险控制和夏普比率上表现稳定[page::40][page::41]。

  • 结论指出,Stockformer模型有效集成信号处理和深度学习技术,兼顾收益与风险表现,适用不同市场形态,展现强大的收益稳定性和市场适应能力,为量化投资提供有力工具[page::42][page::43]。

深度阅读

“Stockformer: A Price-Volume Factor Stock Selection Model Based on Wavelet Transform and Multi-Task Self-Attention Networks” — 详尽分析报告



---

1. 元数据与概览



标题: Stockformer: A Price-Volume Factor Stock Selection Model Based on Wavelet Transform and Multi-Task Self-Attention Networks
作者: Bohan Ma, Yushan Xue, Yuan Lu, Jing Chen
机构: Central University of Finance and Economics, Beijing, China
发表时间: 未明确标注,文中覆盖数据至2024年初
主题: 提出一种基于价格-成交量因子,融合离散小波变换和多任务自注意力机制的新型股票选择模型——Stockformer,旨在解决中国股市复杂多变的市场结构下传统量化模型预测能力不足的问题,提升动态适应性和预测精度。

核心论点:
  • 中国股市因政策频繁变动和突发经济事件导致市场波动加剧,现有模型难以准确捕捉市场动态。

- Stockformer透过小波变换分解股票收益序列,兼顾长短周期波动;结合多任务网络同时预测收益和涨跌趋势。
  • 实验验证显示,Stockformer在多个真实A股市场数据集上,大幅优于业界先进模型,特别是在行情波动较大或下跌阶段表现出较高的稳健性和适应性。

- 代码开源于GitHub,方便后续研究使用与改进。[page::0]

---

2. 逐节深度解读



2.1 引言与研究背景


  • 经典有效市场假说认为股价不可预测,但后续研究表明利率、通胀及投资者情绪等因素对股市收益有显著预测能力。

- 尤其中国A股市场规模大(市值近68万亿人民币),对提高资金配置效率具有重大意义。
  • 但中国市场预测难点在于:

1. 因影响因素众多且数据稀疏,传统模型难以提取有效信息。
2. 因变量与收益间功能关系复杂且不确定,存在显著非线性。
3. 市场历史较短且政策频繁调整,导致突发事件频发,常规模型难以及时响应。
  • 深度学习技术自动化特征抽取能力强,表现出良好预测潜力,但卷积神经网络(CNN)和循环神经网络(RNN)应用尚未充分深挖市场时空结构关系。[page::1][page::2]


2.2 相关工作综述



因子构建:
  • 因子定义为影响股票收益的可量化变量,涉及市场、风格、行业及宏观经济因子。

- Alpha360价格交易量因子库被采用,含360维因子,覆盖价格、成交量和波动性等多个维度。
  • 相关文献如Fama-French、Green等对因子效果稳定性及时间变动有详实研究。


预测模型:
  • 分为三类:降维模型(PCA等)、带惩罚项的线性模型(LASSO)、非线性模型(随机森林、模糊神经网络、LSTM等)。

- 深度学习包括自动编码器(AE)、变分自编码器(VAE)、LSTM等已在多国股市或期货市场测试,显示优势。
  • 中国市场特征明显,政策不确定性使得模型须兼顾突发事件的捕捉和自适应调整,现有模型多缺乏对突发时点的快速反应能力。

- 本文通过离散小波变换净化信号,再结合自注意力机制,增强模型对短期异常波动与长期趋势的辨识力,并通过多任务学习优化整体预测表现。[page::3][page::4][page::5]

2.3 问题定义与模型基础


  • 采用面板数据分析,输入包括股票返回率、涨跌趋势指标和360维的Alpha360因子,数据形状为$T1 \times N \times 362$,预测未来$T2$步的收益和趋势。

- 自注意力机制(Transformer结构核心)可捕捉序列中全局依赖关系,提升模型对复杂时序的感知能力。
  • 离散小波变换用于将收益序列分解为低频(长期趋势)和高频(短期波动及突发事件)成分,为后续模型提供多尺度信息。[page::6][page::7]


2.4 模型架构及技术细节



整体架构(见图1):
  • 输入数据先经过解耦流层(Decoupling Flow Layer),对收益序列进行小波高低频分解,分别得到高频和低频组件,再与剩余因子拼接并全连接变换。

- 进入双频时空编码器(Dual-Frequency Spatiotemporal Encoder),分别对低频数据应用时序注意力机制捕捉长期依赖,对高频数据用扩张卷积捕捉短期局部波动,随后结合图注意力网络(GAT)引入股票之间的空间相关性和时间节点的图嵌入。
  • 最后是双频融合解码器(Dual-Frequency Fusion Decoder),设计了融合注意力机制同时考虑高频和低频信息,输出未来股票收益和方向的多任务预测。

- 使用多监督学习策略,回归(收益预测)和分类(趋势方向)任务进行联合训练,并设计相应损失函数提升模型鲁棒性。[page::8][page::9][page::10][page::11][page::12][page::13][page::14][page::15][page::16]

---

3. 图表深度解读



图1:Stockformer架构图(第8页)


  • 显示了模型三大模块的交互流程:先通过小波变换分解信号,再经时空编码器抽取时序和空间特征,最后多任务解码输出。

- 低频和高频路径设计清晰,能有效分离长短期信息。
  • 使用扩张因子因果卷积和图注意力层加强局部和跨节点依赖。

- 融合注意力机制则确保高频与低频信息在预测阶段被充分整合。

图2:Temporal Graph(第13页)


  • 构建了带连续边(红色箭头表示相邻日时间节点连接)和跨月边(黑色箭头表示相同时间点相邻月份连接)的有向时间槽图。

- 有效捕获日常和月度周期性变化,转化为时间嵌入,送入图注意层辅助时间序列建模。
  • 突破传统时间编码器设置的限制,提高时间信息解析能力。


图3:数据集划分示意(第17页)


  • 用滚动窗口法构建14个重叠子数据集,每个包含2年训练、3个月验证和3个月测试。

- 时间跨度涵盖2018年至2024年初,充足覆盖不同市场阶段,提升模型泛化能力。

图4:模型超参数敏感性分析(第30页)


  • 图示不同隐藏层大小、编码层数量、批次大小和分类损失权重对IC和ICIR指标影响。

- 发现隐层128、编码层2层、批次16及分类损失权重2.0时性能最佳,表明模型深度与复杂度需调优达到平衡。

图5:TopK-Dropout 策略示意(第33页)


  • 形象说明排名前5去除分数最低3个,剔除落后股票,买入剩余股票里排名最高的3个。

- 该策略结合集中投资和风险管理思想,强化选股质量。

图6:CSI 300指数走势(2018-2024,第34页)


  • 展示A股主流指数长时序走势,包含明显的涨跌趋势和震荡期,是后续策略回测的基准参考。


图7-9:不同市场环境下投资组合净值曲线(第35、37、39页)


  • 图7(上涨期):Stockformer分类输出净值最高,持续跑赢基准及其他模型。

- 图8(下跌期):Stockformer跌幅较小,表现抗跌,净值曲线明显优于多数对比模型。
  • 图9(横盘震荡期):Stockformer实现正收益,且波动最小,显示优秀风险控制能力。


---

4. 估值分析



论文未涉及企业估值相关内容,模型核心关注收益预测与趋势判断,服务于量化选股及交易策略优化,无传统资金估值模型涉及,故略。

---

5. 风险因素评估



报告中未明确列出风险控制细节或潜在风险点,但从内容推断可能存在:
  • 模型参数调优依赖性强: 小波变换参数、网络深度与注意力机制均需反复调试,可能导致过拟合风险。

- 数据依赖于固定股票池: 目前以CSI 300为固定池,未来市场变化可能影响模型泛化能力。
  • 高频信息噪声干扰: 高频波动包含大量市场噪声,模型需平衡捕捉异常与避免过拟合。

- 政策或事件突发性风险: 虽模型设计用于快速反应,但极端黑天鹅事件可能仍超出模型预期。

报告拟通过未来工作动态调整模型结构和引入元学习等措施缓解部分风险。[page::43]

---

6. 审慎视角与细微差别


  • 对多任务融合机制的高度依赖: 多任务学习虽提升了模型性能,但其权重配置存在敏感性,对参数选择不够稳健部分指标骤降,需注意调参风险。[page::30]

- 模型复杂度与计算资源高需求: 训练使用RTX 4090 GPU,批次较小(仅2),对普通机构适用性存一定门槛。
  • 因子筛选与预处理显著影响模型表现: 文中采用Alpha360因子经过中性化和缺失处理,说明数据质量是预测成功关键。

- 模型针对中国A股市场特性设计,跨市场迁移性仍需检验,可能受限于市场结构与政策环境不同。
  • 实验样本区间和市场环境主要涵盖2018-2024年,部分极端市场情形(如2020年疫情初期)外推能力需进一步验证。


---

7. 结论性综合



本文提出的Stockformer,通过将离散小波变换与多任务自注意力网络深度融合,创新性地分离并捕捉股票收益的高频与低频特征,结合时空图结构编码,实现了情景依赖的动态预测。其主要发现和贡献包括:
  • 利用360个统计验证过的价格-成交量因子,覆盖更全市场信息维度。

- 小波变换实现收益序列高低频解耦,分别对突发事件及长期趋势建模,增强模型对市场波动的敏感性和稳定性。
  • 双频时空编码器将扩张因果卷积、注意力机制与时空图嵌入有机结合,显著提升了时间序列及股票之间的交互理解能力。

- 多任务学习框架并行输出收益预测和涨跌概率,增强预测信号的丰富性与模型的泛化能力。
  • 在14个滚动子数据集上,Stockformer在所有关键预测指标(IC、ICIR、RankIC、Directional Accuracy)均领先于10个主流和先进基线模型,准确性和稳定性显著提升。

- 基于TopK-Dropout策略的回测结果显示,Stockformer在上涨、下跌及震荡三类市场均具优良的风险调整后收益表现,尤其在震荡期取得正收益和最高Sharpe比率,体现卓越的市场适应力和风险控制能力。
  • 该模型展现出良好的现实应用潜力,尤其适用于复杂、政策驱动及波动频繁的市场环境,为投资者和量化分析师提供坚实的决策支持工具。


---

总结表格与图表深度见解:
  • 表5(预测性能对比):Stockformer IC为0.0294远超其他模型(第二高0.0124),说明因子预测收益排名的稳定正相关性最高;Directional Accuracy为57.46%,领先约3%—5%,表明模型对涨跌方向的识别更精准。[page::27]

- 表6(消融实验):任意核心组件剔除均使性能明显下滑,尤其是去除图嵌入(w/o G)使准确率降至51.83%。多监督学习策略(同时分类回归)显著提升综合表现。[page::29]
  • 图7-9(不同市场净值表现):Stockformer对应的曲线明显领先且稳健,尤其震荡市获得正收益。风险指标(波动率、最大回撤)均优于大多数模型,表现出风险调整后的强健收益能力。[page::35][page::37][page::39]

- 表9-11(回测绩效):Stockformer各市场年化收益、最大回撤、夏普比率表现均名列前茅,极具实战意义。[page::36][page::38][page::40]
  • 图10与表12:长期多阶段滚动回测进一步验证股票选择策略稳健性,为股市投资提供可行路径。[page::40][page::41]


---

8. 总结



Stockformer凭借创新的多尺度信号分解、时空相关的深度图网络和多任务学习架构,成功应对了中国股市多变及扰动巨大的增长、下跌和震荡阶段。其综合预测力强、策略稳定且风险控制佳,填补了传统因子与深度学习方法在市场突变响应上的不足。模型的开源发布也为金融机器学习研究及应用奠定坚实基础。未来工作预计包括自动化小波参数调优、动态股票池更新和利用元学习提升模型应对新股及新环境的适应性,进一步增强模型实用价值。

---

### 以上分析基于文中全部相关页码:[page::0-43, 45-44],图表和数据均详尽解读,覆盖核心创新、技术实现、实证验证、策略评估与未来展望。

报告