HLOB – Information Persistence and Structure in Limit Order Books
创建于 更新于
摘要
本报告提出了HLOB,一种基于Triangulated Maximally Filtered Graph(TMFG)和Homological Convolutional Neural Networks(HCNNs)的高频限价单簿(LOB)中值价格变化方向预测深度学习模型。HLOB通过建模LOB体积及价格层级间的高阶依赖结构,有效捕获非平凡的空间信息结构,在不同微观结构风险股票上,尤其是large-tick类别,实现了对比9种最先进模型的优势,揭示了信息空间分布及其随预测时长的衰减规律,推进了市场微观结构与深度学习的结合研究 [page::0][page::2][page::5][page::15][page::20][page::26]
速读内容
- HLOB模型创新点及设计理念 [page::2][page::8][page::10]:
- 结合TMFG通过计算不同LOB体积层级间的互信息,去噪并提取统计显著依赖结构。
- 利用HCNN架构处理由TMFG导出的3种拓扑结构(四面体、三角形和边)作为输入的空间结构特征。
- 叠加LSTM模块捕获长期时间依赖,增强时序预测能力。


- 数据与实验设定 [page::6][page::7][page::12][page::13]:
- NASDAQ交易所15只股票,涵盖小、中、大tick规模,3年高频LOB数据,10档买卖价量,涵盖40天训练、5天验证、10天测试。
- 进行多模型对比实验,包含8个先前文献模型和2个Transformer变体,总共1350次实验,累计GPU时长约7200小时。
- 标注设定基于中值价格跳动超过tick大小,三个预测时长为10、50和100个LOB更新。
- HLOB模型性能表现 [page::14][page::15][page::16][page::17][page::18][page::19][page::20]:
- 在最短预测时长(Δτ=10)下,HLOB在73.3%测试场景中表现最佳,特别是中tick和大tick股票表现稳定优异。
- 性能随预测时长增长略有下降,但对于大tick类股票依然保持较强预测能力。
- 与其前身DeepLOB相比,HLOB在F1、MCC及交易成功概率pT均有显著提升。
- 在所有模型中,HLOB与BinBTabl和BinCTabl并列,均为预测准确率高但交易活跃度偏高的模型。

- LOB空间信息结构及深度学习影响 [page::22][page::24][page::25][page::26]:
- 小tick股票LOB层级互信息整体低且结构弱,信息漂移严重,预测时效性较短。
- 大tick股票展现明显层级互信息结构,LOB层级定义更稳定,深度依赖结构持久。
- 这些结构差异直接影响模型对不同股票类别预测准确度和持久性。



- 量化因子/策略构建及回测未涉及具体策略,但HLOB通过微观结构编码提升预测精准度 [page::8][page::26]:
- 无直接量化交易策略展示,研究重点在于通过信息过滤网络揭示LOB结构并结合HCNN深度学习增强价格波动方向预测。
- 模型对不同股票微观结构特征适应性强,具备实用的微观结构感知能力。
深度阅读
HLOB – Information Persistence and Structure in Limit Order Books: 深度详尽分析报告
---
1. 元数据与概览
- 报告标题:HLOB – Information Persistence and Structure in Limit Order Books
- 作者:Antonio Briola, Silvia Bartolucci, Tomaso Aste
- 发布机构:英国伦敦大学学院计算机科学系,伦敦政治经济学院系统性风险中心
- 发布日期:未明示,研究引用数据截至2024年初
- 研究主题:金融市场微观结构,特别是包含深度学习模型的限价单簿(Limit Order Book, LOB)中高频交易价格变动预测方法。
报告核心论点与目标
本报告提出一种全新的大型深度学习模型“HLOB”,用于预测限价单簿中的中价(mid-price)变动方向。核心创新点有两方面:
- 利用信息过滤网络(Information Filtering Network),特别是三角最大过滤图(Triangulated Maximally Filtered Graph, TMFG)捕获LOB多层次间不平凡的依赖关系;
2. 引入受同调卷积神经网络(Homological Convolutional Neural Networks, HCNN)启发的确定性设计,应对LOB系统的复杂性。
研究在三个真实的纳斯达克交易所LOB数据集(包含15只股票)上,将HLOB模型与九个当前先进深度学习模型进行了系统比较。结果显示,HLOB在多数场景下优于其他模型,尤其是在揭示信息空间分布和未来预测有效期方面有独特贡献。报告致力于缩小微观结构建模与高频金融市场深度学习预测之间的鸿沟。[page::0]
---
2. 逐节深度解读
2.1 引言(1页)
报告首先强调金融市场的复杂性源自两个方面:
- 多个异构交易主体在不同时间尺度上的互动,利用信息不对称形成交易策略;
- 无中央控制下的自组织集体现象,导致市场中存在间歇性和短暂性的效率缺陷。
在高频交易环境中,LOB作为市场参与者买卖意愿的实时快照,是市场微观结构的核心信息承载体。LOB内订单包括市价单、限价单和撤回单,交易系统采用FIFO等规则处理,导致市场出现信息不对称。
高频交易(HFT)利用交易速度的优势,基于内部LOB信息产生获利机会,存在“捕食者-猎物”动态关系。尽管HFT常被监管关注,其对市场内数据的依赖被认为有助于维持价格波动的随机噪声特性。
随着高频数据量巨大且复杂,深度学习因其强大的非线性建模能力被广泛用于预测LOB动态,但方法的实际有效性因不同股票的微观结构特征差异而异。具体而言,具有较大“价差刻度”(tick size)的大价差股票(large-tick stocks)其LOB结构更紧凑,深度模型表现较好;反之,小价差股票(small-tick stocks)LOB结构稀疏,模型有效性下降。此部分为后续研究建立了现实背景及理论基础。[page::1]
2.2 本文贡献(三页)
报告明确三大贡献:
- 提出HLOB模型,基于HCNN引入TMFG构造的依赖结构,捕捉LOB体量级的深层次复杂关系;
2. 揭示信息内容的空间结构在时间上的脆弱性和不同股票微观结构对预测时效性的影响;
- 基于实证测试(9个SOTA模型,3组15只股票数据),给出模型选择参考,基于解释性、预测时效及技术资源等因素。
论文结构清晰,后续章节分别探讨相关工作、数据集介绍、模型框架、实验结果,以及总结未来挑战。[page::2]
2.3 相关工作(3页)
- 限价单簿(LOB)复杂机制:介绍LOB作为电子交易系统的关键数据结构,通过价格和成交量的不规则变动反映市场买卖双方的博弈。重点定义了价格层级、买卖量、价差(spread)、中价(mid-price)等基础概念。
- 深度学习在LOB预测中的应用:综述了MLP、LSTM、CNN、Bag-of-Features、注意力机制和Transformer等多种架构在预测交易价格变化方向时的使用。指出不同模型基于空间和时间的局部与长依赖特征提取机制。
- 信息过滤网络与同调神经网络基础:介绍IFN用于提取变量间的依赖关系,突出三角最大过滤图(TMFG)的优势(封闭性、平面图特性和最大化似然),为HCNN和HLOB设计的资料工具。HCNN利用TMFG结构的高阶联通单元(如四元组tetrahedra)做卷积操作,捕获更复杂的空间依赖关系,这超出传统CNN仅处理连续层次的能力。[page::3-5]
2.4 数据集(2页)
15只纳斯达克股票,涵盖6大行业,基于2017-2019年3年数据,分成小、中、大三种“tick size”类别,详见附表1。数据采用LOBSTER提供的逐笔LOB快照,包含10个买卖深度层。
数据集结构严谨,采用训练—验证-测试时间序列分割(非重叠),并应用5天滚动窗口的特征标准化,防止数据泄露。价格运动方向标签基于未来N个LOB更新后中价的变动超过1个tick的正负性,重点在不同时长(10、50、100步更新,即短中长中期)预测中价上涨、下跌或稳定。这种用"步长"而非时间定义的视角,更贴近高频交易的事件驱动特性。[page::6-7]
2.5 模型方法(4页)
- TMFG构建流程:
仅采用LOB中买卖侧的量数据,量化为等宽分箱处理以缓减噪声后计算变量间的互信息(MI)。对不同交易日的MI矩阵进行平均后输入TMFG构建算法,该网络最小化了基于KL散度的信息熵,自动滤去弱依赖,保留具有统计相关性的关键边,从而形成具有层级和几何属性的依赖网络(顶点是量层,边表示高MI的联系)。图1视觉呈现该过程,MI矩阵颜色和节点边权均按介数中心性编码,透露节点在网络中的重要性及联系强度。[page::8-9]
- 从HCNN到HLOB:
TMFG输出为三种拓扑结构的集合(4节点四面体、3节点三角形、2节点边),其分别以形状确定的张量形式输入模型。 为融合价格信息,每个卷积输入维度中均嵌入对应的价格水平。三者分别经由不同的卷积头独立抽取特征后合并,最后由LSTM层捕捉长期时间相关性。
三层卷积设计细致:第一层(1×2)步幅1×2,强调价格-量对;第二层分别处理对应简单形(四面体、三角形、边)的邻域关系,步幅防止跨组混淆;第三层(1×Ω)整合简单形的总体信息,辅助捕获数据分布中的全局非局部特征。隐含的正则化策略为dropout,保证泛化能力。
整体参数量丰富,结合图3提供的网络层构造参数量,体现模型处理复杂度和精细结构的能力。[page::10-11]
2.6 实验设计与基准模型(3页)
对比评价模型覆盖了6个公开的基准深度模型(CNN1、CNN2、DLA、BinBTabl、BinCTabl、DeepLOB),2个基于变换器的时间序列预测模型(Transformer、iTransformer),以及改进版LobTransformer混合模型。表3揭示各模型的参数规模与推断速度,体现从参数省量到复杂模型的性能差异。
训练细节严谨:采用AdamW优化,跨股票且跨年训练,共计1350场实验,累计GPU时间超7192小时,保障了结果的全面性和统计有效性。[page::12-14]
---
3. 图表深度解读
3.1 表1:股票列表及市值分类
展示15个纳斯达克股票的标识名、行业归属及连续三年市值统计,辅以tick size分组,体现了数据集的行业多样性及样本代表性。此表为数据聚类提供底层支撑。 [page::6]
3.2 表2:训练/验证/测试时间区间划分
时间序列划分合理,排列训练与测试样本连续性,验证集随机分布在训练区段内确保泛化检测不泄露未来信息。此种划分合规市场微观研究的因果性要求。 [page::7]
3.3 图1:TMFG构建示意
- 展示从原始LOB体量(体积)数据转化为分箱数据的降噪,然后计算互信息矩阵,最终构建网络。
- 颜色和边宽反映节点边的介数中心性,指出在信息传播中的地位。
- 该图将数学步骤具体化,有助于理解IFN将高维变量关系转为易处理拓扑结构的整个流程。[page::9]
3.4 图2和图3:HLOB模型输入准备及模型结构
- 图2示意了TMFG的三种简单形结构如何提取并与价格水平融合,最终形成三组张量作为输入特征。颜色编码便于对应三组输入通道。
- 图3展示了三头并行卷积结构处理三组输入后合并,继而通过LSTM捕捉时间序列动态,最后输出三分类预测(上涨、下跌、稳定)。
- 该视觉结构体现模型对空间复杂依赖和历史动态的双重捕捉,并直观说明了设计的卷积层尺寸与参数。 [page::10-11]
3.5 表3:基准模型参数量和推断时间
- 细节展现不同深度模型在训练复杂度和实际使用延迟的权衡。
- BinBTabl最精简,LobTransformer最复杂,HLOB参数和推断时间介于中上游。
- 该信息为模型选择提供硬件成本和实时应用实践参考。[page::13]
3.6 表4至表6:各预测跨度(10、50、100)模型性能比较
- 量化指标为F1分数、Matthews相关系数(MCC)、和执行成功率($pT$)。
- 结果显示,HLOB分别在短期(73.3%),中期(60%),和长期(33%)场景中总体优于其他9个模型,表现依股票tick group不同而起伏。
- 对比DeepLOB,HLOB在F1、MCC及$pT$指标上均表现有增益,尤其在更短的预测窗口和大tick股票中效果更显著。
- 详细解释了模型性能随预测时间窗口的衰减现象及微观结构下的差异,[page::14-18]
3.7 图4:模型round-trip交易概率与执行数的分布
- 在三预测长度上展示$pT$指标与总交易数(TT)的关系和模型聚类。
- 把模型划分为四象限,定义了性能与交易活跃度权衡:
- 象限I(高$pT$低TT)理想模型;象限II(高$pT$高TT)高效但活跃;
- 象限III(低$pT$低TT)保守但效果差;象限IV(低$pT$高TT)效果最差。
- HLOB归类于象限II,说明虽预测准确,但交易频度相对较高;该特性随预测时间延长趋于平衡。
- 通过与其它模型比较,强调HLOB对空间特征建模优势及时间依赖的相对弱点。 [page::19-20]
3.8 图5-7:三类股票的互信息矩阵热图
- 按股票tick分组显示三年期内不同股票成交量层间的归一化平均互信息。
- 小tick股票(图5)表现为信息稀疏,LOB不同层间依赖弱,如CHTR和GOOG顶部层信息较集中,但整体结构松散易有漂移;
- 中tick股票(图6)某些股票如AAPL顶部与深层区分明显,ABBV和PM 信息分布更集中于顶层;
- 大tick股票(图7)则展现出明显分层结构,互信息水平较高,LOB层间依赖紧密且持久,如BAC等表现优良。
- 表7提供实际LOB“深度”指标,印证了大tick股票结构更稳定,支持深度学习稳健预测的假设。[page::22-26]
---
4. 估值分析
报告无传统金融估值内容,主要侧重模型架构与性能比较,无DCF、P/E等财务估值,本节不适用。
---
5. 风险因素评估
报告未明示详细风险评估,但间接指出:
- 模型效果受限于股票的微观结构特性,尤其在小tick股票中,信息漂移与层级不稳定性增大,导致预测性能下降。
- 依赖平均互信息构建的TFMG结构受异常点和非平稳性的影响,限制了信息捕捉的时间持久性和实际应用范围。
- HLOB关注空间关联,未能像双重注意力模型同时兼顾时间动态,可能影响长期预测能力。
- 部分SOTA模型缺乏开源代码,降低了研究结果的复现性与验证的公开性。
---
6. 批判性视角与细微差别
- 方法创新:HLOB通过结合TMFG和HCNN框架,引入了微观结构相关的空间依赖考量,弥补了传统CNN只能捕获邻近层依赖的缺陷,理念具有高度创新性。
- 数据分类巧妙:报告利用tick size作为微结构划分依据,使结果更具行业和股票类型解释力,提升了结论的应用适用性。
- 时效性限制:依赖静态平均互信息构造相对固定的依赖图,未考虑依赖关系随时间演化,这可能导致远期预测表现下降,模型适应性受限。
- 复杂度与效率:HLOB虽然参数量适中,但推断时间仍高于部分简洁模型,实际高频交易环境的延迟容忍度值得评估。
- 比较中潜在偏差:部分对比模型为从公开代码实现或借鉴,而非全部来自作者团队原始实现,可能存在再现性及配置一致性差异风险。
- 未来方向未明细:报告提出动因后,未系统论述如何扩展动态IFN,未来模型如何减少执行开销与提升时间演化建模能力尚存不确定。
---
7. 结论性综合
本文推出的HLOB架构通过引入基于信息过滤网络的高阶结构建模及同调卷积网络,创新性地捕获了LOB中价格和成交量层间非线性、高级别的空间依赖,使得该模型在短期($\Delta\tau=10$)中价变动方向预测上,相比九种当前主流深度学习模型达到了73%的情况优胜,且在中期($\Delta\tau=50$)和长期($\Delta\tau=100$)依然具备不俗表现,尤其对大tick股票有较强预测稳定性。
通过对实际交易数据的MI矩阵分析,报告证明:
- 小tick和中tick股票中,LOB信息结构稀疏且不稳定,限制了深度模型的持久有效性,预测性能随着时间窗口增加显著衰减;
- 大tick股票则展现出紧密分层和稳定的信息结构,有利于构建更有针对性的拓扑依赖网络,提升预测效果;
- 这一微观结构特征差异是模型性能表现的根本驱动因素。
HLOB的独特优势在于其基于TMFG的空间结构先验,将体量级别的复杂依赖关系具象化,赋予了深度学习更强的结构感知能力。同时改进模型结构,结合LSTM处理时间动态,从而平衡了空间和时间依赖的建模。与先前如DeepLOB的仅邻层卷积模型相比,HLOB少许提升了平均F1分数和MCC,优化了信息利用效率。
图表分析与实证结果一致,HLOB模型有效揭示了秘藏于LOB多层体量交互中的隐藏信号,从而在短期内给予交易决策更强的指导价值。模型同时展示了不同微观结构股票上对应不同预测能力的脉络,为未来设计自适应预测模型提供了理论支撑。
HLOB缺少对时间演化依赖关系的建模,是导致长窗口预测性能不及部分双重注意力机制模型的关键,未来可考虑引入动态IFN结构自适应。尽管目前HLOB交易频率较高,未来可针对交易成本与模型效率间权衡,进一步优化其实用价值。
总之,该报告通过详细理论论证与充分实验对比,展示了基于信息过滤和同调卷积的新型结构感知深度学习架构HLOB在限价单簿高频价格变动预测领域的领先地位,以及结合微观结构特性的精细化模型设计重要性。在维持模型解释性的基础上,有效捕获了深层空间依赖和短期时序动态,成为高频金融建模的重要参考和创新里程碑。[page::0-27]
---
附:关键图表示意 markdown格式引用
- TMFG构建流程示意图:

- HLOB输入准备示意图:

- 预测绩效与交易活跃性关系图:

- 小、中、大Tick股票互信息热图系列:



---
总结:本报告从微观结构金融市场的复杂性切入,通过结合数学信息过滤网络和深度学习先进架构的创新设计,突破传统浅层空间依赖建模限制,提出面向高频交易的实用且理论清晰的HLOB模型,展现出突出的实证效果和理论价值。