`

Event-Based Limit Order Book Simulation under a Neural Hawkes Process: Application in Market-Making

创建于 更新于

摘要

本文提出了一种基于12种限价单簿事件的事件驱动LOB模拟模型,利用Neural Hawkes过程提升对事件间非线性依赖的捕捉能力,构建了动态midprice过程。通过深度强化学习框架实现了更真实的高频做市策略回测,模拟结果在价格波动性、订单成交分布等方面与真实市场数据高度一致,验证了方法的有效性 [page::0][page::2][page::3][page::8][page::11][page::14][page::18][page::21]。

速读内容

  • 模型框架及事件定义 [page::0][page::1][page::3]

- 利用Neural Hawkes过程模拟12种关键LOB事件,覆盖激进与非激进买卖入市及撤单等分类,真实反映LOB事件动态。
- 中价(midprice)过程基于事件跳跃,定义价格跳动方向与幅度,通过非均匀时间步长准确模拟市场价格演变。
  • 数据与事件频率分析 [page::4][page::5][page::12]

| 事件类型 | AAPL | AMZN | GOOG | INTC | MSFT | 事件概率 |
|---------|-------|-------|-------|-------|-------|----------|
| LB+ | 16,805 | 6,611 | 6,496 | 739 | 951 | 0.0150 |
| LS- | 17,474 | 6,993 | 6,381 | 869 | 1,078 | 0.0155 |
| MB+ | 5,876 | 1,871 | 1,748 | 725 | 931 | 0.0053 |
| MS- | 6,227 | 2,368 | 2,111 | 695 | 888 | 0.0058 |
| 其他事件| ... | ... | ... | ... | ... | ... |

- 事件频率展示非激进事件占比更高,验证模型捕捉真实市场事件分布。
  • Neural Hawkes过程模型与训练 [page::7][page::9][page::10]

- 以LSTM为核心的神经网络建模事件强度函数,输入包括事件类型独热编码和市场状态(基于买卖量不平衡指标)。
- 训练采用负对数似然函数,20轮Epoch,使用RMSprop优化,训练与测试误差相近,精度稳定。




  • LOB事件模拟分布及中价路径 [page::11][page::12][page::14][page::15]

- 200次仿真下每种事件的累计频数近似真实数据分布,非激进事件较多,部分激进事件比例略高于真实市场。

| 事件类型 | AAPL (sim) | AMZN (sim) | GOOG (sim) | INTC (sim) | MSFT (sim) |
|----------|------------|------------|------------|------------|------------|
| LB+ | 2,790 | 1,984 | 2,781 | 1,884 | 2,290 |
| LS- | 3,092 | 1,640 | 2,841 | 1,836 | 2,239 |
| MB+ | 3,111 | 1,764 | 2,625 | 1,937 | 2,534 |
| MS- | 2,469 | 1,572 | 2,639 | 1,966 | 2,211 |
| 其他事件 | ... | ... | ... | ... | ... |

- 中价路径显示,模拟价格演化趋势、波动率及尖峰厚尾特征与真实市场相似,但偏度和Hurst指数略有偏差。






  • 深度强化学习做市策略实现及参数设置 [page::15][page::16][page::17][page::18]

- MM智能体在最优动作集中决策是否在买卖价位放单,受持仓约束影响。
- 订单成交根据事件驱动逻辑严格匹配激进及非激进市场订单,实现真实成交模拟。
- 奖励函数设计为期望终端财富扣减持仓惩罚,强化资金与风险管理。
  • 做市性能对比(模拟 vs 真实数据)[page::19][page::20][page::21]

- 模拟与真实市场均呈现负向累计奖励分布,策略学习有效但单一策略难盈利。
- 激进市场订单主导成交,非激进订单贡献有限,且两种数据集中成交比例高度相似。









| 资产 | AAPL | AMZN | GOOG | INTC | MSFT |
|--------|-------|-------|-------|-------|-------|
| 真实成交偏差比 | 3.209 | 3.420 | 3.234 | 2.000 | 1.951 |
| 模拟成交偏差比 | 3.087 | 3.463 | 3.415 | 1.971 | 1.608 |
  • 量化因子与策略亮点 [page::3][page::7][page::11][page::13][page::18]

- 构建基于12种LOB事件的非线性多元Hawkes因子,结合市场状态变量,Neural Hawkes过程实现事件强度动态更新。
- 使用带时间衰减的LSTM单元精细刻画事件间复杂的激励和抑制效应,提升模型拟合与预测精度。
- 量化模型用于仿真LOB事件序列,并结合深度强化学习优化做市策略,模拟交易执行更贴近实盘。

深度阅读

金融研究报告详尽分析报告



元数据与概览


  • 标题:Event-Based Limit Order Book Simulation under a Neural Hawkes Process: Application in Market-Making

- 作者:Luca Lalor 和 Anatoliy Swishchuk
  • 发布机构:加拿大卡尔加里大学数学与统计系

- 日期:2025年2月25日
  • 主题:本文聚焦于金融市场的限价单簿(Limit Order Book, LOB)事件模拟,利用神经Hawkes过程建立事件驱动的LOB模型,并在高频市场做市(Market-Making, MM)策略中应用该模型。


核心论点
报告提出一种基于神经Hawkes过程的事件驱动LOB模拟框架,该框架详细描述了十二种LOB事件,能够真实反映限价单簿中的时序事件动态和相互影响。通过结合深度强化学习(Deep Reinforcement Learning, DRL)技术,完成了高频做市策略的模拟,实现了模拟交易订单的执行分布与真实市场数据的高度一致。其主要贡献在于提供了更贴近实际市场行为的LOB模拟工具,支持更准确的高频策略回测。[page::0-2]

---

逐节深度解读



1. 引言


  • 传统LOB模型大多基于价格过程的近似,忽视了真实LOB事件的非均匀离散时间戳特征,导致模型无法准确捕捉事件之间的依赖关系,尤其在高频交易策略表现出严重偏差(如“幻影收益”现象)。

- 报告指出,传统基于扩散过程的中价模型(如布朗运动)无法识别特定LOB事件对价格变动的具体贡献,特别是在做市策略中,限价单容易在市场逆向变动时被执行,这种逆向选取风险无法用扩散模型准确模拟。
  • 本文采用12类核心LOB事件的非线性多变量Hawkes过程,搭配神经网络(LSTM)构架的神经Hawkes过程,以模拟事件间复杂的长短期相互影响和抑制机制,提升模型拟合能力。

- 同类研究如Lu & Abergel (2018) 提出的线性MVHP和Gasˇperov & Kostanjcˇar (2022) 的做市方案均被本研究通过非线性MVHP和神经Hawkes过程方法所扩展和完善。[page::1-2]

2. Midprice Process Modeling



2.1 LOB事件定义


  • 精选12类LOB事件,包括积极(aggressive)和非积极(non-aggressive)订单及撤单,区分事件是否触发中价变动。

- 积极事件例:积极限价买单(LB⁺)、积极市场买单(MB⁺),均导致中价上升。
  • 非积极事件例:非积极限价买单(LB⁰)、非积极市场卖单(MS⁰),不改变中价但影响事件强度。

- 使用NASDAQ股票(AAPL、AMZN、GOOG、INTC、MSFT)6月21日2012年全日LOBSTER数据,统计各事件发生频率(见表1)。非积极事件出现概率较高,且均被纳入模型强度函数。
  • 指出非线性MVHP更适合捕捉复杂依赖关系及事件间抑制效应,突破线性MVHP的加法叠加限制。[page::3-5]


2.2 多变量Hawkes过程建模


  • 构建12维多变量计数过程N(t),每类事件$i$具有条件强度函数$\lambdai(t)$。

- 采用指数核函数$\mu
{ij}=\alpha{ij}e^{-\beta{ij} t}$捕捉事件j对事件i的自我激励与交叉激励,非线性转换器$\phii$保证模型非线性灵活性。公式(1)(2)。
  • 事件划分为令中价上升的事件集$Ou$,下跌事件集$Od$,无变化事件集$On$。

- 中价过程定义为跳跃过程,跳幅由对应事件状态映射函数$a(Xk), b(Xl), c(X_m)$给出,跳幅可变,较Lu & Abergel(2018)中固定1 tick更具灵活性。具体公式(3)详述该过程的离散时间演化。
  • 强调跳跃过程跳幅分布来自历史数据,体现不同事件不同跳动大小,更真实反映市场价格动态。[page::5-7]


3. 神经Hawkes过程模拟



3.1 神经Hawkes过程架构及训练


  • 将传统HP模型扩展为连续时间递归神经网络(LSTM),解决传统HP强度函数固定形态和仅正激励的问题。允许激励系数为负,体现抑制效应及非线性复杂依赖。

- 模型输入:12事件类别的one-hot编码+市场状态特征(基于买卖盘量比的量价失衡指标$I$),区分市场平衡、买盘偏多或卖盘偏多。
  • LSTM架构详述输入门、遗忘门、输出门、记忆单元及隐状态的更新机制(公式7a-7g)。

- 输出使用Softplus激活确保预测强度函数非负,12个事件各自对应独立的LSTM单元,实现事件特定的记忆与激励动态。
  • 训练基于LOBSTER数据,60%训练,20%验证,20%测试,迭代20 epoch,损失函数为负对数似然(公式8),优化器使用RMSprop,结果参见表2与图2,模型训练效果良好,准确率及损失稳定收敛。

- 使用Ogata稀释算法模拟数据,验证模型事件频率分布,模拟结果(表3、图3)与真实数据一致性总体较好,非积极事件比例略有偏高,但优于传统HP模型表现。
  • 强调神经Hawkes模型突破传统HP线性可加限制,提供更丰富的市场事件动态模拟能力。[page::7-12]


3.2 中价过程模拟及结果


  • 利用前述事件模拟跳跃中价过程,跳幅分布基于现实数据,跳幅具有宽泛离散集,且高度偏态(图4),资产间跳幅数目及统计指标(波动率、偏度、峰度、Hurst指数)比较真实与模拟数据(表4),模型能较好复现波动率与峰态特征,但偏度与Hurst指数偏差较大。

- 中价模拟路径(图5)展示5只股票价格时序走势,模拟轨迹保留大致行情形态,体现模型捕获整体价格动态能力。
  • 报告指出需改进模型以更准确捕捉细节市场特征,例如绝对偏度和市场趋势性/均值回复性质。

- 强调与传统金融资产价格模拟(如几何布朗运动E-M离散)相比,事件驱动的中价模型更符合高频交易时的实际事件动态。[page::13-15]

4. 事件驱动做市策略的深度强化学习应用



4.1 做市问题框架


  • 利用事件驱动的神经Hawkes LOB模拟,中价和事件驱动的流水真实性高,使得做市策略模拟能匹配订单成交时点与类型,避免扩散模型下成交填充随机与价格过程无关缺陷。

- MM代理在最佳买卖价位发布限价单,力图最大化终端收益,约束包括最大仓位上限$q$,风险惩罚系数$\psi$鼓励平仓。
  • 状态变量包含价格和仓位,动作空间根据当前位置动态调整(公式定义),可以控制是否挂单或者撤单。

- 交易成交逻辑区分恶意成交(aggressive)和非恶意成交(non-aggressive),前者对应模型中必然成交的市场买卖单$M B^{+}, M S^{-}$,后者对应部分成交概率$p$的市场单$M B^{0}, M S^{0}$,精确体现限价单成交通道。[page::15-17]

4.2 资产对应模拟结果与真正数据对比


  • 深度强化学习采用Soft Actor-Critic (SAC)算法,使用Stable Baselines3实现,模型于仿真数据和真实市场数据分别训练测试,参数详见表5。

- 终端累计回报直方图(图6-7)表明策略表现对仿真与真实数据均以负回报为主,且分布较接近,显示出使用事件驱动神经Hawkes模拟生成的数据能有效支撑高频做市策略的训练与评估。
  • 成交订单对应市场单类别分布(图8-9)显示做市策略的成交主要来自积极市场单,非积极市场单较少,仿真数据与真实数据保持高度一致,验证了模型在订单层面模拟的准确性。

- 表6中的恶意成交与非恶意成交比值也反映了模拟和真实数据间的匹配,且均偏重于恶意成交,提示策略面临真实且重要的逆向选取风险。
  • 该部分首次实现了将神经Hawkes事件驱动LOB模拟应用于深度强化学习做市框架,为研究高频做市策略提供了新的实验平台和数据源。[page::18-21]


---

图表深度解读



表1(第5页)


描述:展示5只主要股票(AAPL、AMZN、GOOG、INTC、MSFT)在2012年6月21日交易日中,每种LOB事件类型的发生总数及事件概率分布。
分析:非积极事件(如非攻限价单或撤单)占据较大比重,活跃度最高。积极事件相对较少但对价格影响显著。
联系:该数据用于训练和校验事件强度模型,保证模拟数据的真实性分布。

表2(第10页)


描述:神经Hawkes模型训练及测试损失与准确率结果。
分析:训练和测试损失稳定下降,准确率稳步提升,表明模型学习效果良好,且泛化能力较好。INTC和MSFT资产表现最佳。

图2(第11页)


描述:模型在不同资产上训练期间损失与准确率随epoch演变曲线。
分析:损失函数下降过程光滑,准确率稳步增加,曲线趋于平稳,表明训练收敛。适当停止训练避免过拟合。

表3(第12页)


描述:200次模拟中,5只股票各种LOB事件发生的累计频数。
分析:非积极事件仍占大头,仿真相较真实数据略倾向积极事件,但整体事件分布形态保持一致,说明模型成功捕捉事件频率。

图3(第12页)


描述:5只股票中,首次模拟的事件类型时间分布点图。
分析:事件类型散布均匀,周期性和簇聚现象明显,体现真实市场LOB事件时间结构。

图4(第14页)


描述:5只资产中跳幅大小的频率直方图,展示跳幅极度偏态分布。
分析:多数跳幅集中在1 tick附近,少数极端跳幅存在。该分布反映现实跳价规律,是精细建模的关键。

表4(第14页)


描述:跳幅数目及真实与模拟数据对比的波动率、绝对偏度、峰度、赫斯特指数指标。
分析:模拟波动率和峰度接近真实,偏度和赫斯特指数存在差异,说明模型捕获统计特征向总体正确,但微观动态仍需优化。

图5(第15页)


描述:5只股票中模拟的中价时间序列走势。
分析:价格走势呈趋势性与波动,类似真实行情。

表5(第19页)


描述:深度强化学习做市模型参数设置,包含最大仓位、非激进成交概率、训练和测试数据样本量等。

图6-7(第19页)


描述:仿真与真实数据的做市策略各100次测试回报终值分布。
分析:均呈现负回报趋势,且分布相似,说明模型有效再现市场条件且策略表现具有一致性。

图8-9(第20-21页)


描述:模拟与真实市场中4类市场订单对MM限价单成交次数时间序列,色彩区分事件类型。
分析:积极市场订单导致成交明显多于非积极订单,且两组数据分布趋势类似,验证了事件模拟的真实性及在策略分析中实用价值。

表6(第21页)


描述:5资产中做市代理人的恶意成交与非恶意成交比例真实数据与模拟数据对比。
分析:两者比例接近,且普遍偏向恶意成交,体现市场逆向选取风险,对策略影响重大。

---

估值分析



本报告的核心在于高频做市策略的事件驱动模拟,并未涉及传统意义上的资产估值方法或目标价设定,故不涉及DCF、市盈率等估值技术分析。其价值体现在建模复杂依赖结构及交易策略模拟的先进性和准确性上。[page::全稿]

---

风险因素评估


  • 模型假设风险:跳幅分布、事件强度模型基于历史单日数据(2012年),市场结构变化可能导致模型失效。

- 模型欠拟合风险:训练准确率最高约为56%,存在一定预测错误概率,可能导致模拟事件分布失真。
  • 策略简单性风险:所采用的MM策略较为基础,未能涵盖复杂交易策略与市场冲击,限制了策略盈利潜力。

- 数据时效性风险:模型基于2012年数据,市场微结构演化及算法交易发展可能导致模型难以泛化未来市场。
  • 非线性及抑制效应准确捕捉难度:尽管神经Hawkes过程允许负激励和复杂时序依赖,但由于架构复杂,难完全捕获所有市场细节。

- 回测环境简化风险:虚拟环境中对资金成本、交易费用、滑点等现实影响的建模未详尽叙述,可能高估实际策略表现。

报告虽未系统讨论风险缓解策略,但强调模型可扩展性强,推荐进一步细化LOB事件种类与模型结构,提升准确度。[page::21]

---

批判性视角与细微差别


  • 本研究创造性地结合事件驱动LOB模型与深度强化学习做市,确实弥补了传统扩散模型与简单HP模型的缺陷。

- 训练与测试准确率未达到极高水平,部分事件预测存在不确定性,影响模拟精度。
  • 模拟中非积极事件比例偏差为后续提升方向,可能因模型对事件复杂依赖捕获不足。

- 高频跳幅统计指标表现显示模型能够捕捉大部分分布形态,但偏度和Hurst指数模拟不佳,暗示市场微观动态的非平稳性及内生性未完全被建模。
  • 做市策略表现仅中性或略负,反映现实市场中高频做市难以通过简单优化获得超额利润,也表明模拟策略的简化。

- 研究中未列出交易成本和流动性冲击,实际交易环境影响值得深究。
  • 总体视角稳健,但需注意模型假设单一,数据限制较多。[page::10,14,19,21]


---

结论性综合



本文开创性地提出并实现了基于神经Hawkes过程的12类LOB事件驱动模拟框架,实证验证其模拟LOB事件动态及中价跳跃的能力,同时将此模拟模型嵌入深度强化学习高频做市策略中,实现了交易订单执行的事件级别匹配。这一框架较传统基于扩散或线性Hawkes模型更精细地反映了市场微结构中事件的非均匀性、非线性激励及抑制效应。模型在大部分统计特征(波动率、峰度)匹配良好,虽在某些细节(偏度、Hurst指数)尚有差距,展现了高频市场的复杂性与模拟难度。基于神经Hawkes模拟生成的深度RL做市策略表现与真实市场极为相似,尤其在交易订单类型分布与成交时间匹配上高度契合,体现了事件驱动模拟的市场实用价值。该研究不仅推动了高频交易模拟技术的发展,也为策略设计和风险管理提供了新的量化工具。未来研究可从扩展事件种类、提升跳幅及事件预测准确度和引入更多市场变量入手,进一步提高模拟与真实市场的拟合度及策略回测的实用性。

---

正文中涉及重要图表



Figure 1


Figure 1
神经Hawkes流程图,展示输入(12个LOB事件+3个市场状态)、Hawkes LSTM细胞和输出层softplus激活及强度预测,体现事件时序依赖动态。

Table 1


详见正文第5页,事件频率分布,支持训练与验证强度模型。

Figure 2


Figure 2
各资产训练期内损失与准确率曲线,展示模型训练过程及收敛状况。

Table 3


模拟数据中事件频数,确认模型有效再现事件比例和动态。

Figure 3


Figure 3
事件在时间上的发生分布,体现事件簇聚性及多样性。

Figure 4


Figure 4
跳幅大小极度右偏直方图,揭示跳幅分布特征。

Table 4


统计指标对比,验证模拟数据与真实市场的统计相似性。

Figure 5


Figure 5
中价模拟轨迹,反映资产价格动态走向。

Figures 6 & 7


Figure 6
Figure 7
深度RL做市策略回报分布对比,模拟与真实数据的近似一致。

Figures 8 & 9


Figure 8
Figure 9
MM成交订单对应市场单事件类型的时间序列,展示良好匹配。

---

结语



本文报告通过创新的神经Hawkes事件驱动模型和深度强化学习结合,实现了对高频市场做市策略的精细模拟和真实行为的模拟验证,为高频金融建模和算法交易领域贡献了新工具与新思路,适合学术研究和实务应用的交叉演进。阅读和采用本文框架需关注模型训练数据局限及应用情景匹配,未来不断调优与扩展可提高模型的市场适应性和策略性能。 [page::全稿]

报告