A DECOUPLED LOB REPRESENTATION FRAMEWORK FOR MULTILEVEL MANIPULATION DETECTION WITH SUPERVISED CONTRASTIVE LEARNING
创建于 更新于
摘要
本文针对多层级限价委托簿(LOB)中隐蔽的交易操纵(如欺诈性“假挂单”行为)检测难题,提出一种结合级联LOB表示与监督对比学习的新型表示学习框架。该框架通过引入Transformer嵌入模块和双重损失函数,有效提升表示区分度,显著改善多层级操纵行为检测性能。实验覆盖多模型、多输入配置,验证了多层级异常的复杂性及LOB数据适当表示的关键价值,Transformer架构获得最优结果。消融分析突出级联表示流水线及监督对比学习的贡献,为复杂序列数据的异常检测提供新洞见[page::0][page::1][page::4][page::6][page::8][page::9]。
速读内容
多层级操纵检测问题定义与挑战 [page::0][page::2]
- 多层级交易操纵(如假挂单)利用LOB多个深层级别隐藏欺诈行为,表现为复杂且跨层次的异常模式。
- 传统方法多基于单层数据或手工特征,难以捕获多层次隐蔽异常。
- 多层级异常信号稀释,检测难度显著高于单层异常。
框架设计与技术创新 [page::3][page::4]
- 提出三级模块架构:数据准备(注入多层异常+构造手工特征+归一化)、表示学习(级联LOB嵌入模块+主表示模型)、异常检测(冻结表示器+无监督检测器OC-SVM/Isolation Forest)。
- 级联LOB嵌入模块采用Transformer预训练提取深层LOB特征,与手工特征融合,提高表示质量。
- 训练采用加权混合损失函数:MSE重建损失+监督对比损失,强化正负样本区分,配合异常过采样缓解数据不平衡。
多模型与多输入实验验证 [page::6]

- 实验基于NASDAQ三只股票合成数据,注入多层假挂单异常。
- 方法在JFDS(基于Transformer)模型上取得多指标领先,OC-SVM和Isolation Forest均显著提升AUC-PR/F4-Score。
- CNN2、LSTM、SimLOB模型微幅提升,FEDformer、TimesNet对LOB数据适配性差,表现不稳定。
多层级LOB数据的价值体现与相关挑战 [page::7][page::8]


- 多层级异常检测性能明显逊于单层级,验证异常信号稀释与检测复杂性。
- 单纯加入LOB数据效果不佳,结合监督对比与级联嵌入显著改善,多模型普遍受益。
- FEDformer和TimesNet因架构不符,LOB数据反而带来性能折损。
框架消融与超参数敏感性分析 [page::8][page::9]

| Oversampling Ratio (β) | AUC-PR | AUROC | F4-Score |
|----------------------|--------|-------|----------|
| 0.5 | 0.470 | 0.956 | 0.852 |
| 0.3 | 0.470 | 0.946 | 0.828 |
| 0.1 | 0.483 | 0.950 | 0.834 |
| 0 (无采样) | - | - | - |
| Contrastive Loss Weight (α) | AUC-PR | AUROC | F4-Score |
|-----------------------------|--------|-------|----------|
| 1 | 0.252 | 0.583 | 0.498 |
| 0.8 | 0.540 | 0.962 | 0.868 |
| 0.5 | 0.526 | 0.958 | 0.851 |
| 0.2 | 0.470 | 0.946 | 0.828 |
| 0 | 0.252 | 0.854 | 0.653 |
- 级联LOB嵌入结构对提升表现作用显著,Transformer表现最佳。
- 过采样机制为对比学习正常发挥关键,采样比例仅需≥10%即可稳定工作。
- MSE与对比损失缺一不可,联合优化保证结构表达与分类区分性能。
结论与未来方向 [page::9]
- 框架有效结合了结构化LOB信息和有监督对比训练,解决了多层级异常隐蔽难检问题。
- 多层级异常检测难度高,需专门设计表示学习与训练策略。
- 未来研究可探索更适合LOB的模型架构、改进对比目标及拓展至更多市场异常检测任务。
深度阅读
报告深度分析报告
报告标题: A Decoupled LOB Representation Framework for Multilevel Manipulation Detection with Supervised Contrastive Learning
作者: Yushi Lin, Peng Yang
发布机构: Southern University of Science and Technology,广东省脑启发智能计算重点实验室;统计与数据科学系
日期: 未明示,参考文献最晚为2024年,推测为2024年左右
研究主题: 多层级金融市场异常检测,聚焦于交易操纵中的“虚假挂单”(Spoofing)行为的检测,基于多层级限价委托簿(Limit Order Book, LOB)数据设计新的表示学习框架并融合有监督对比学习。
---
一、元数据与报告概览
本报告旨在解决金融市场中的交易操纵问题,特别是“虚假挂单”这一多层次、多维度的复杂违规行为。金融市场作为全球经济重要组成,交易操纵尤其是TBM(Trade-Based Manipulation)会严重干扰市场公正性和稳定性。现有方法多从单层级异常入手,难以捕获隐藏于深层LOB中的多层级异常模式。
作者提出一个解耦的LOB表示学习框架,采用级联的多层LOB表示生成管道,结合有监督对比学习(Supervised Contrastive Learning, SCL)以提升表示的判别能力。框架兼容多种时间序列模型,实验证明Transformer架构表现最佳,实现了该领域的最新性能水平。报告主要传达的信息是:通过全新的表示学习方法与训练范式,能够有效捕捉和检测多层级的隐藏交易操纵行为,并为复杂的序列异常检测问题提供了有益启示。
---
二、逐章深度解读
2.1 报告摘要与引言
- 摘要指出,交易操纵特别是虚假挂单是一种多层级异常,已存在因LOB数据高维噪声难处理导致建模不足的问题。作者提出结合级联LOB表示流水线和有监督对比学习的新框架,在多模型、多个指标上超越现有效果。[page::0] [page::1]
- 引言阐述交易操纵(尤其由CSRC、SEC严密监管)对市场公平的威胁,虚假挂单常隐藏在LOB的2-5层,难被传统单层模型捕捉。[page::0]
- 强调现有机器学习方法关注单层异常,不足以覆盖更为隐蔽、多层次结构的操纵行为,提醒需要挖掘LOB多层级结构信息。[page::0]
2.2 背景与问题定义
- LOB定义: 表示为多层级($l$级,每一级包含买卖价及对应量)价格与交易量的四维矩阵,数据具有高维度($4 \times l$)、时序强相关性及空间异质性,是多层级异常检测的基础。[page::1]
- 交易操纵定义: 关注TBM,特别是虚假挂单,即故意挂大量无执行意图的订单通过操纵挂单深层层次,误导市场形成假象,然后快速撤销获利。[page::2]
- 异常检测定义: 转化为二分类任务,输入为时序段$Xt=\{St,...,S{t+T-1}\}$,代表一段时间窗口中的LOB状态,经过编码器映射为潜在向量$zt$,再由判别函数输出正常/异常标签。核心挑战是学习能反映多层级异常的潜在表征。结构公式和检测流程明确标注,展示任务的明确数学归纳。[page::2]
2.3 框架设计
- 框架设计为三阶段模块:数据准备、表示学习、异常检测,解耦且各阶段模块可替换。[page::2]
- 数据准备阶段新颖设计了多层级异常注入,非传统单层注入,注入覆盖5层,利于训练多层异常检测模型;构造手工特征,规范化收敛训练;设置两种训练模式:传统(仅正常样本训练),和新设计(混合少量异常样本便于对比学习)。[page::3]
- 表示阶段引入自动编码器架构来压缩高维数据,创新点在于两层级联:先由专门训练的Transformer编码高维LOB信息得到低维嵌入,再将嵌入与手工特征融合,送入主模型以得到最终潜空间表示。[page::3][page::4]
- 异常检测使用冻结的表示模型输出潜空间特征,采用经典无监督模型以支持泛用性,包括OC-SVM和Isolation Forest,输出时序的异常评分。[page::4]
- 有监督对比学习训练策略:结合MSE重构损失和监督对比损失(区分异常和正常样本聚类),通过少量异常样本超采样解决类别不平衡提升判别性能,监督对比损失定义清晰,采用cosine相似度及温度系数加权调整距离。[page::4] [page::5]
---
三、图表深度解读
3.1 框架结构图(图1,page 3)

该图展示数据流和模块划分:
- 数据原始采集后依次注入异常、构建手工特征和规范化,分成两种数据模式用于训练。
- 表示阶段强调Lob嵌入模块(可替代架构),与手工特征融合后输入主表示模型(可选LSTM、CNN、Transformer、SimLOB等),同时使用复合损失。
- 最终阶段为无监督检测,使用目前训练冻结的特征生成器,结合OC-SVM/Isolation Forest判别异常,输出逐时间点异常分数。
- 模块解耦性强、流程逻辑清晰,凸显方法设计的灵活可扩展性。
---
3.2 绩效对比表(表1,page 6)
|检测方法|表示模型|训练模式|AUC-PR|AUROC|F4-Score|Precision|Recall|
|-|-|-|-|-|-|-|-|
|OC-SVM|无表示|无|0.163|0.759|0.609|0.160|0.739|
|OC-SVM|CNN2|原始/提议|0.176/0.198|0.777/0.855|0.604/0.707|0.155/0.149|0.738/0.923|
|OC-SVM|JFDS|原始/提议|0.252|0.854|0.653|0.238|0.733|
|OC-SVM|LSTM|原始/提议|0.675/0.160|0.975/0.795|0.881/0.601|0.402/0.158|0.952/0.728|
|OC-SVM|SimLOB|提议/原始|0.375/0.164|0.902/0.768|0.734/0.603|0.166/0.144|0.935/0.754|
|Isolation Forest|无表示|无|0.101|0.736|0.562|0.133|0.705|
- JFDS结合提议方法(含级联表示和对比损失)实现了OC-SVM和Isolation Forest上的最优性能,为当前自动编码器+无监督检测方法最佳结果。
- 多数模型在新方案中整体指标上升,CNN2、LSTM、SimLOB等显著提升AUC-PR和召回率。
- FEDformer、TimesNet表现参差不齐,显示模型与LOB数据特性匹配度关键。
- 该表实证了结合级联表示和监督对比学习在多模型、多指标上的优势。
---
3.3 多层级异常检测难度对比图(图2, page 7)

- 图示比较只注入单层(Level-1)异常与多层(Level-5)异常的AUC-PR。
- 各模型多层异常均低于单层,清晰展现多层异常的检测更具挑战性,因信号在多层间分布稀释阅读。
- 说明一般单层异常检测模型难以直接适用于复杂多层级操纵场景。
---
3.4 输入与损失对检测性能影响(图3, page 7)

左图:整体5层级异常检测;右图:关注2-5级异常检测。
三输入模式对比:无LOB数据;带原始LOB;带嵌入LOB数据;两种损失函数对比:仅MSE,和复合损失(结合对比损失)。
- 发现单纯增加LOB数据和MSE损失表现无明显提升,反而带噪声影响性能。
- 结合复合损失后,大部分模型(除FEDformer、TimesNet)显著提升性能,尤其使用嵌入LOB数据时效果最佳。
- 2-5层异常检测性能较全层指标更低,强化多层级异常检测的难点。
- 总结LOB数据对异常检测具有价值,但需适当表征并结合对比学习优化损失设计。
---
3.5 级联LOB表示流水线消融研究(图4, page 8)

用JFDS+OC-SVM,比较无级联表示与多种LOB编码器(Transformer、LSTM、SimLOB、CNN2)性能差异。
- 级联表示显著提升AUC-PR,尤以Transformer编码最佳。
- CNN2编码反而下降,提示不是所有模型均适合复杂LOB级联嵌入。
- 对AUC-PR提升尤为明显,反映其对稀有异常事件检测的特化优势。
- 级联模块有效缓解LOB数据高维噪声与结构异质性问题。
---
3.6 超采样率与对比损失权重敏感性分析(表2、表3,page 9)
|超采样率 β|AUC-PR|AUROC|F4-Score|
|-|-|-| -|
|0.5|0.470|0.956|0.852|
|0.3|0.470|0.946|0.828|
|0.1|0.483|0.950|0.834|
|0|失败| -| -|
|对比损失权重 α|AUC-PR|AUROC|F4-Score|
|-|-|-|-|
|1|0.252|0.583|0.498|
|0.8|0.540|0.962|0.868|
|0.5|0.526|0.958|0.851|
|0.2|0.470|0.946|0.828|
|0|0.252|0.854|0.653|
- 不做异常超采样时模型无法正常训练对比损失,说明合理采样平衡对训练至关重要。
- 超采样比例对性能影响有限,0.1起即可达到较好效果,说明关键是解决极端类别不平衡。
- 混合损失设计收益显著,单一MSE或纯对比损失均表现较差,凸显两者互补。
---
四、估值分析(方法评价)
本报告虽非传统金融估值分析报告,无市盈率等估值模型,但对算法性能采用了多维度指标AUC-PR、AUROC、F4-Score等进行诊断,评估框架提升的实效性。结合多模型对比实验,体现提出方法在金融数据异常检测领域的实证估值优势,尤其在捕获隐蔽多层级异常方面效果最佳。
---
五、风险因素评估
报告未直接展开具体风险因素章节,但隐含风险包括:
- 数据来源与真实性: 使用合成数据注入异常,真实市场情况更复杂且多变,模型泛化能力或受到限制。
- 模型兼容性问题: 实验中FEDformer、TimesNet效果不佳,透露部分先进时间序列模型可能不适配特定LOB特征。
- 异常样本稀缺性: 极度不平衡现象存在,依赖超采样和有限标注,真实性和策略变动风险。
- 方法普适性: 当前研究仅针对Spoofing,其他TBM策略适应性、适配性尚待实验验证。
风险管理方面拟通过模块替换、持续实验和模型调优缓解,未来工作期待设计更专门的LOB架构和扩展到其他异常场景。[page::9]
---
六、批判性视角与细微差别
- 报告在多处强调Transformer架构优势,但对某些模型表现不佳的原因仅作推测,缺乏更深入原因剖析。
- 使用合成异常数据固然业界通行,但其与真实异常复杂性仍有差距,可能影响模型实际有效性。
- 报告中级联结构的具体网络设计未详细叙述,相关细节设计及其对性能贡献尚不可复现,留待未来研究。
- 对超采样比例和对比损失权重敏感性分析较基础,未涉及更多超参数调优空间。
- 部分性能指标在不同模式下波动较大,模型稳定性仍需观察。
整体而言,报告提出思路科学严谨,实验设计全面,但在真实场景适用性和系统实现细节方面存提升空间。
---
七、结论性综合
本报告针对交易操纵中最隐蔽的多层级虚假挂单行为,提出了创新的多层LOB表示学习框架,结合级联LOB嵌入与监督对比损失,以解决高维、噪声、层级复杂的问题。
通过广泛的对比实验,报告验证了:
- 多层异常明显较单层更难检测,标准方法表现逊色,凸显问题实质复杂性。
- 级联LOB嵌入模块成功缓解复杂数据结构异质性,Transformer架构下实现显著性能提升。
- 混合MSE+监督对比损失结合有限异常样本超采样策略,极大增强判别潜空间的区分力,提升检测稳健性。
- 多个时代序列模型在框架下均获性能提升,表明方法具备良好代表性与通用性,局部模型适配性需深入探索。
- 图表证据充分支持多层异常检测面临的内在困难与解决方案优越性。
最终,该框架及训练范式使得JFDS模型以OC-SVM判别器实现在合成多层虚假挂单检测中的当前最好效果,是交易操纵检测领域的一项重要进展,为金融市场安全的智能保障提供了有效手段。报告同时展望未来将继续探索更专门的LOB结构模型、丰富监督策略、及扩展至更多异常检测任务,预期进一步促进该领域理论和应用的发展。
---
全文溯源页码标签均附于相应段落,确保结论与数据清晰对应。