`

Trade When Opportunity Comes: Price Movement Forecasting via Locality-Aware Attention and Iterative Refinement Labeling

创建于 更新于

摘要

本报告提出LARA框架,通过局部感知注意力机制(LA-Attention)提取潜在盈利样本,并利用迭代细化标签方法(RA-Labeling)适应性修正噪声标签。实验涵盖股票、加密货币及ETF市场,结果显示LARA在精准率、收益率等多指标上显著优于现有机器学习方法,增强了对真实交易机会的捕捉能力 [page::0][page::1][page::2][page::3][page::5][page::6]。

速读内容

  • 研究问题与核心目标:[page::0][page::1]

- 金融价格走势预测面临极低信噪比和高度随机性,传统机器学习模型易过拟合噪声,难以捕捉真实盈利信号。
- 本文提出LARA框架,目标在于有效提取潜在盈利样本并修正其标签,从而提升预测准确性和泛化能力。
  • LARA框架方法论 [page::2][page::3]


- LA-Attention包括度量学习模块与局部化模块,结合掩码注意力机制和任务相关距离度量,局部提取高盈利概率样本。
- RA-Labeling通过迭代方式结合预测器输出,基于训练损失动态调整标签置信度,自适应细化噪声标签;提供两种整合策略:使用最后模型预测或所有模型预测均值。
  • 量化因子与指标定义 [page::1][page::2]

- 预测目标为资产价格未来Δ步的价格变动趋势,二分类标签基于价格涨跌是否超过阈值λ。
- 概率阈值thres用于筛选潜在盈利样本,利用局部关注邻近样本的加权注意力估计样本的正类概率。
  • 度量学习提升邻域注意力效果 [page::3]


- 通过Mahalanobis距离的度量学习,提高特征空间中样本结构的区分度,使得LA-Attention对潜在盈利样本的估计更精准。
- 实验t-SNE可视化显示度量学习增强的嵌入空间显著提高了正样本比例及对应平均收益。
  • 实验设置及市场数据 [page::4]

- 采用中国A股、加密货币(BTC/USDT)、ETF三类真实市场数据,时间跨度涵盖数年,高频成交数据及多种技术因子。
- 数据集根据时间序列划分训练、验证和测试集,输入维度基于价格和成交量相关特征构造。
  • 定量实验与性能评估 [page::5][page::6]

| 方法 | A股精度(%) | 加密货币精度(%) | 平均收益(AR) |
|-------------|-------------|------------------|------------------|
| ALSTM | 51.9 | 47.9 | 3.24E-3 (A股) |
| Transformer | 53.2 | 38.7 | 5.73E-3 (A股) |
| LightGBM | 55.0 | 51.0 | 7.26E-3 (A股) |
| SEAL | 56.6 | 53.0 | 5.95E-3 (A股) |
| RA-Labeling | 55.2 | 56.2 | 3.53E-3 (A股) |
| LA-Attention| 56.6 | 51.2 | 5.27E-3 (A股) |
| LARA | 59.1 | 57.8 | 7.79E-3 (A股)|

- LARA在精准率、平均收益和风险调整后胜算比均优于多种主流机器学习及时间序列方法,特别是在股市与加密货币市场均展现稳定优势。
  • LA-Attention在训练与测试阶段的作用验证 [page::6]

| 训练阶段 | 测试阶段 | 精准率(%) | 胜率比(WLR) | 平均收益(AR) |
|-----------|----------|-----------|-------------|--------------|
| ✓ | ✓ | 78.58±0.67| 2.957±0.259 | 0.196±0.003 |
| ✓ | ✗ | 70.16±0.89| 2.872±0.106 | 0.166±0.002 |
| ✗ | ✓ | 70.39±1.07| 2.757±0.184 | 0.166±0.002 |
| ✗ | ✗ | 37.82±11.09|1.712±0.188 | 0.062±0.037 |

- 表明在两个阶段都应用LA-Attention显著提升模型性能,忽视任一阶段均导致效果下降。
  • 实盘交易频率与收益表现 [page::6]


- LARA在不同交易频率下均展现更高精准率和累计收益,且交易频率随市场波动变化动态调整,符合市场预期与风险管理需求。
  • 量化因子构建与策略总结

- LARA非传统因子构建方式,核心为利用局部度量学习调整样本空间衡量,结合迭代标签修正提升训练样本质量。
- 通过局部邻域注意力筛选高概率样本,降低训练数据噪声干扰;迭代标签细化增强模型在高噪声市场中的鲁棒性与表现。
- 该方法适用于股票、ETF及高频加密货币市场,回测结果显示对潜在盈利信号捕捉能力优异。

深度阅读

金融研究报告详尽分析报告



---

1. 报告元数据与概览



报告标题:
《Trade When Opportunity Comes: Price Movement Forecasting via Locality-Aware Attention and Iterative Refinement Labeling》

作者及机构:
梁增(Liang Zeng)、王磊(Lei Wang)、牛辉(Hui Niu)、张茹晨(Ruchen Zhang)、王岭(Ling Wang)、李坚(Jian Li)
机构包括清华大学交叉信息研究院(IIIS)和华泰证券有限公司(Huatai Securities Co., Ltd)

发布时间:
论文提交于2023年,发表于IJCAI-24会议。

研究主题:
针对金融资产价格走势预测,提出一种结合“局部感知注意力机制(Locality-Aware Attention)”和“迭代标签精炼(Iterative Refinement Labeling)”的新型机器学习框架LARA,旨在提升金融时间序列中低信噪比高噪声数据的预测准确性,尤其聚焦于提取潜在的“有利交易样本”,并对其标签进行迭代优化。

核心观点及贡献:
  • 传统基于机器学习的金融预测方法普遍面临极低信噪比难题,且难以有效区分有利可图的信号与噪声。

- LARA框架设计了两大关键模块:(1)通过局部感知注意力机制(LA-Attention)提取潜在盈利样本;(2)通过迭代标签精炼(RA-Labeling)模块自适应纠正这些样本的噪声标签。
  • 在包含股市、加密货币和ETF的真实市场数据上,LARA显著优于现有多类机器学习模型,尤其在捕捉可靠交易机会方面表现突出。


---

2. 逐章节详解



2.1 引言与背景(Introduction)


  • 关键论点:

金融市场的价格走势预测极具挑战性,主要由于市场具有高度的随机性和动态性(即价格表现近似随机游走)。有效市场假说(EMH)提示价格变动难以预测,但市场并非完全有效,存在信息不对称及交易者噪声行为,提供了利用机器学习策略“打败市场”的可能。
  • 机遇与难点:

当前机器学习方法通常训练于全量连续时间段数据,然而市场中真正有利的信号稀少且掺杂大量噪声,模型易过拟合噪声,预测效果受限。因此,识别和聚焦在“潜在盈利样本”——即更具预测价值的时点或样本,显得尤为重要。核心技术难点在于如何从极其嘈杂的数据中挖掘出这些样本,同时确保标签的准确性。

2.2 潜在盈利样本的定义与提取(图示1、章节2)


  • 挑战一: 如何有效从噪声中提取潜在盈利样本?

- 解决方案一: 引入局部感知注意力机制(LA-Attention),结合掩码注意力和度量学习技术,通过学习一个合适的“距离度量”,使得在样本特征空间内相近且带标签信息的邻居对该样本的有利标签贡献更大,从而对概率$p{\mathbf{x}t}$进行估计,筛出高概率样本。
  • 挑战二: 如何针对潜在盈利样本的标签噪声进行自适应修正?

- 解决方案二: 利用迭代精炼标签方法(RA-Labeling),依据模型预测结果和训练损失动态调整样本标签的置信度,对噪声标签进行平滑和修正,多个预测器融合以增强整体预测鲁棒性。

2.3 数据与问题设定(章节3)


  • 标签定义基于固定时间跨度$\Delta$后的回报是否超过阈值$\lambda$,将价格趋势量化为二分类任务。

- 训练集和测试集分别由$N$个时点的$d$维特征向量和对应标签组成,测试时严格利用历史信息预测未来趋势,避免数据泄漏。

---

3. LARA 框架详解



3.1 局部感知注意力(LA-Attention)


  • 流程:

1. 利用局部掩码注意力机制,仅关注特征空间中查询点局部邻域$\mathcal{N}(\mathbf{x}t)$的样本,实现对当前样本正类概率$p{\mathbf{x}t}$的估计。
2. 对邻居的权重采取两种策略:简单等权重或基于马氏距离的反比例加权。
3. 度量学习模块通过优化带标签的样本间马氏距离矩阵$M$,加强相同类样本间的相似性,强化邻居筛选的有效性和准确性。
  • 优势:

引入度量学习后,LA-Attention可更准确地识别潜在盈利样本,图3的t-SNE示例显示该方法使得样本的正负分布更加分离且令平均回报值明显提升,反映提取样本的质量得到改善。

3.2 迭代标签精炼(RA-Labeling)


  • 核心思想:

凭借多轮迭代方式,根据模型当前预测与样本标签间的一致性动态调整标签置信度$\alpha
j^k$,并对标签进行移动平均更新,进而抑制噪声对模型训练的扰动。
  • 算法细节:

每轮先使用当前标签训练模型,依据损失判断标签置信度,更新标签为当前标签和模型预测的加权平均,持续迭代$K$轮。最终方式包括单模型预测(取最后一轮模型)和多模型投票平均两种组合策略。
  • 目的:

该方法专门针对金融市场中标签极易受随机波动影响、相似样本标签相反的情况,力求提升训练数据的标签质量和模型泛化能力。

---

4. 重要图表和数据深度解读



图1(页1)


  • 该图直观展示金融样本在特征空间中的分布和相应回报概率的混合。红点代表潜在盈利的正类样本,蓝三角为非盈利负类样本。顶部分布曲线显示期望回报的概率密度函数,强调盈利样本集中在特征空间两端,符合“行情两头抓”的特征。
  • 这突显了需要针对性筛选的必要,即模型需要聚焦于这部分亏损概率较低且预计正收益的样本。


图2(页2)


  • 清晰阐释了LARA框架整体工作流程:先由LA-Attention模块通过度量学习和掩码注意力从整体数据中抽取潜在盈利的样本子集,再由RA-Labeling模块针对这些样本迭代校正标签,最终联合多次训练结果生成鲁棒预测器。
  • 图中不同图形(红点、蓝三角、树估计器、线性网络等)帮助理解整体模型的组件如何协作提高模型质量。


图3(页3)


  • 利用t-SNE对ETF数据的1000个样本进行嵌入表示分布。逐步对比:

- 左图:直接数据样本,正负样本混合,平均回报接近0。
- 中图:仅通过局部注意力机制筛选的样本,正样本比例有所提升(27.9%),平均回报提升明显。
- 右图:引入度量学习后样本正类比例近50%,且回报均值进一步提高至$8.42\times10^{-4}$,显示出筛选能力的显著提升。
  • 该图验证了LA-Attention结合度量学习模块的有效性,提升了潜在盈利样本的识别准确度。


表1(页5)


  • 在中国A股和加密货币两大市场对比若干先进机器学习及时间序列方法。关键指标包括精度(PR)、盈亏比(WLR)、平均收益(AR)。

- LARA在两大市场均取得最高精度(59.1%、57.8%)和较高平均回报,领先第二名约2.5%和1.5%。
  • 这个优势表明LARA更有效识别正收益样本,同时表现出较低的风险(WLR>1说明盈利交易占优)。

- 表中“噪声标签方法”如CNLCU、FINE、SEAL表现也优于传统模型,突显处理标签噪声重要性;LARA作为包含选择和精炼标签双重机制的综合方法,整体表现最佳。

图4(页6)


  • 左图显示不同交易次数下,LARA相较传统OLS和LightGBM在精度上的明显优势,且性能稳定。

- 中图展示在512480.SH ETF数据上的累计收益曲线,LARA持续领先其他基线,表明长期交易策略收益能力更佳。
  • 右图关联高频交易次数与沪深300指数价格,揭示LARA在市场波动剧烈时交易频率增加,符合预期“波动即机会”的投资逻辑。


表2(页6)


  • 针对LA-Attention模块在训练及测试阶段使用与否进行消融,显示同时在训练和测试阶段使用LA-Attention使精度提升至78.58%,较只用一阶段提升显著(训练阶段独用为70.39%,测试阶段独用仅37.82%)。

- 说明LA-Attention需贯穿训练和测试两个流程,方能充分发挥提取潜在盈利样本的作用。

---

5. 估值分析



本报告聚焦于价格趋势预测模型的设计与实证验证,没有传统公司估值部分。故无具体估值模型、折现率或倍数法分析。

---

6. 风险因素评估



报告明确指出金融价格数据固有的高噪声和低信噪比特性是主要挑战,这使得标签本身常带噪声(甚至相似样本标签相反),进而影响模型泛化能力。为缓解此风险,LARA通过双重机制:
  • 精准选取预测可靠的样本(减少噪声数据干扰)

- 迭代修正噪声标签(提高训练标签质量),使模型更稳健。

此外,报告未详细展开宏观市场风险、模型过拟合风险以及执行时交易成本等其他外部风险,但通过交易策略设计控制交易频率及持仓,间接控制风险暴露。

---

7. 批判性视角与细微之处


  • 偏见与假设:

LARA假定存在一部分潜在盈利样本在特征空间中具有可区分结构且可借助度量学习捕捉,这一前提在某些极端高效市场或极端非平稳环境下可能失效。
  • 模型的局部邻居定义(k近邻或半径邻居)参数的选取影响样本选择效果,报告虽提及参数敏感性在附录中讨论,但主文未详述,可能影响实际部署适用性。

- 标签精炼方法依赖超参数$\epsilon^k$调节标签置信度,$r<10\%$表现相对稳定。这一阈值适用范围与泛化能力未知,可能限制实际复杂市场中操作灵活性。
  • 内部矛盾:

表2的四个实验行未包含“训练和测试联合使用”的显式对比组合,需推断训练集和测试集时是否开关LA-Attention时的具体环境设定,尚存小幅理解空间。

---

8. 结论性综合



本报告系统提出了LARA框架,融合了局部感知注意力机制和迭代标签精炼技术,针对金融市场价格趋势预测中的低信噪比和标签噪声挑战提供了一整套创新解决方案。通过局部邻居加权结合度量学习获得样本正类概率估计,精准筛选潜在盈利样本,再利用迭代自适应标签修正提高训练数据质量,形成双重保障机制,提升整体预测准确度和鲁棒性。

实证部分涵盖中国A股、加密货币和ETF三类不同市场,横向对比多类时间序列模型、经典机器学习方法及多种噪声标签处理算法,LARA均实现显著优异表现。尤其在交易信号精度、平均收益和盈亏比方面均遥遥领先,证明有效捕捉了更可靠的交易机会。

图表解析显示,LA-Attention结合度量学习显著增强了潜在盈利样本的区分度和平均收益水平。迭代标签精炼则有效缓解了样本标签噪声的负面影响,使模型实现更好的泛化效果。消融实验进一步验证需同时在训练和测试阶段使用LA-Attention才能获得最佳性能。

整体而言,报告综合理论与实证,提供可操作性强且效果出色的方法,为金融时间序列价格预测领域提供了有力技术手段,有望推动量化投资与机器学习结合的进展。

---

参考溯源



本文所有分析严格基于报告中提供内容,引用原文页码如下:
[page::0,1,2,3,4,5,6]

报告