Algorithmic and High-Frequency Trading Problems for Semi-Markov and Hawkes Jump-Diffusion Models
创建于 更新于
摘要
本文提出一种结合跳跃过程与扩散过程的跳跃扩散定价模型,专门针对算法交易与高频交易中的限价单簿(LOB)价格动态建模。模型中跳跃部分分别采用半马尔可夫过程和霍克斯过程,捕捉非马尔可夫性及市场簿跳跃特点,并通过扩散近似获得数值可解的最优控制策略。基于真实LOB数据,研究了资产获取与清算问题,模拟了价格路径、库存变化与执行交易速度,显示跳跃成分显著影响最优交易节奏及策略表现,为算法交易执行策略改进提供理论支持与实践指引[page::0][page::2][page::3][page::4][page::5][page::6][page::7][page::8][page::9][page::10][page::11][page::12][page::13][page::14][page::15][page::16][page::17][page::18][page::19][page::20][page::21][page::22][page::23][page::24][page::25][page::26][page::27][page::28]
速读内容
- 本文针对算法交易与高频交易(HFT)市场中资产价格动态,提出结合半马尔可夫过程与霍克斯过程的跳跃扩散模型,更精准刻画限价单簿(LOB)的非马尔可夫跳跃特性,并将跳跃组件通过扩散近似转化为可处理的跳跃-扩散定价模型 [page::0][page::1][page::2][page::3][page::4][page::5][page::6]。

- 半马尔可夫模型允许非指数的状态转移等待时间分布,更合理模拟LOB中订单间非指数分布及状态依赖特性;采用扩散近似对跳跃部分参数化,刻画期望漂移系数和波动率分量(见方程(3)(5)),提升价格过程准确性 [page::4][page::5]。
- 霍克斯过程作为自激点过程,适合模拟LOB中订单簇集效应及跳跃;基于此构建的跳跃扩散定价模型(见方程(8)(9)),同样采用功能中心极限定理实现跳跃近似,定义漂移与波动率系数(详见方程(10)(11))[page::6][page::7]。
- 价格过程建模融合永续永久影响和暂时性冲击,永久影响函数$g(\nut)$和暂时冲击函数$f(\nut)$线性依赖于交易速度,资产执行价定义为中价加上价差及暂时冲击,构建现金流与库存的状态变量 [page::7][page::8]。
- 设计两类以随机最优控制为基础的交易问题:①获取(Acquisition)问题:在价格上限$S{max}$和时间$T$限制下,最优买入$\mathfrak{N}$单位资产的速度控制;②清算(Liquidation)问题:在价格下限$S{min}$和时间$T$限制下,实现最优卖出$\mathfrak{N}$单位资产的速度 [page::8][page::9][page::12]。
- 获取问题和清算问题通过动态规划原理(DPP)转化为各自的Hamilton-Jacobi-Bellman (HJB)型偏微分方程,利用分离变量和简化假设$b=0$降维处理形成状态方程,构造反馈形式的最优交易速度控制策略(见方程(27)(32)(38)(46))[page::9][page::10][page::12][page::13]。
- 使用华盛顿微软(MSFT)2012年限价单簿数据对参数进行校准,结合隐式-显式有限差分法(IMEX)数值求解价值函数,展示不同$\sigma$(扩散波动率)和$\varsigma$(跳跃扩散分量)情境下的最优交易速度$h$函数分布,与Cartea等纯扩散模型对比(见Figure 2和3)[page::13][page::14][page::16][page::17]。


- 量化交易策略模拟对比:在不同$\bar{\sigma}$和$\varsigma$参数设定下,运行10,000条随机价格路径,观察交易路径、平均成交价、库存和交易速度演化(Figures 4-15)。结果显示:
- 跳跃成分($\varsigma$)显著增加价格波动率,使得最优策略更倾向于提前完成目标交易量。
- 在获取问题中,价格若快速上涨,算法会加快买入速度,避免因为价格上限限制导致支付高额终端罚金。
- 在清算问题中,价格快速下跌时,加快卖出速度,防止价格跌破下限造成损失。












- 本文模型适用非平稳高频市场环境,有效捕捉跳跃风险对执行策略的影响。未来研究方向建议包括:拓展市场状态下的模型参数适应,结合深度强化学习强化无模型策略,及在杠杆化的Levy过程框架中推广跳跃扩散定价模型 [page::27][page::28]。
深度阅读
资深分析师对报告《Algorithmic and High-Frequency Trading Problems for Semi-Markov and Hawkes Jump-Diffusion Models》的全面详尽解构分析
---
一、元数据与概览
- 报告标题:《Algorithmic and High-Frequency Trading Problems for Semi-Markov and Hawkes Jump-Diffusion Models》
- 作者及单位:Luca Lalor 与 Anatoliy Swishchuk,均隶属加拿大卡尔加里大学数学与统计系
- 发布日期:2025年3月6日
- 研究主题:算法交易与高频交易(HFT)中基于半马尔可夫(Semi-Markov)和霍克斯(Hawkes)跳跃-扩散模型(Jump-Diffusion Models)的资产定价与交易优化问题。
核心论点与贡献:
该论文提出一种集成独立跳跃与扩散过程的跳跃-扩散定价模型,专门用于算法交易和高频交易中对限价单簿(LOB)动态的精准建模。针对当前算法和高频交易环境中的非马尔可夫特性,论文引入了基于复合半马尔可夫和霍克斯过程的跳跃成分,进而开发扩散近似,方便求解最优交易策略。通过随机最优控制(SOC)理论框架,设计了买入(acquisition)与清仓(liquidation)两类交易问题的优化方案,并基于实际LOB数据进行模型参数标定及策略仿真,验证了新模型在更广泛价格动态下对执行策略改进的实用性和有效性。论文对交易速度、库存演化和执行价格路径的模拟揭示了跳跃动态的关键影响。[page::0, page::2, page::3]
---
二、逐节深度解读
2.1 引言与背景(Section 1)
- 关键论点:
- 股票等金融资产价格演变不仅包含扩散(布朗运动)部分,还存在非平稳、非马尔可夫性的跳跃动态,这来自限价单簿重大事件和大宗交易等信息驱动。
- 已有文献基于纯扩散模型(如Cartea et al., 2015)或单纯跳跃模型(Swishchuk等),均难以捕捉非马尔可夫跳跃的复杂特征。
- 故本文旨在提出通用的跳跃-扩散价格过程,融合半马尔可夫和霍克斯过程的跳跃机制,以及布朗运动扩散部分,应对高频交易中非平稳非马尔可夫的LOB动态。
- 推理依据:
- 通过半马尔可夫过程解决原始马尔可夫模型无法拟合LOB订单簿非指数分布等待时间的问题。
- 霍克斯过程适合描述价格跳跃的自激聚集特征,反映某些事件引发连续跳跃。
- 视觉化微软2012年6月21日股票价格中见到的跳跃特征(图1),佐证必须使用跳跃-扩散混合模型。[page::1, page::2]
2.2 半马尔可夫和霍克斯跳跃-扩散模型(Section 2)
- 半马尔可夫模型(Section 2.1):
- 在基本扩散模型基础上,加入跳跃项,跳跃由半马尔可夫过程控制,跳跃幅度由两个状态的遍历马尔可夫链决定,跳跃时间间隔非指数分布。
- 该模型允许价格以更灵活的时间分布跳跃,更符合实际LOB交易节奏。
- 通过定理证明在时间尺度扩展后(长时间尺度tn替代高频毫秒尺度t),跳跃过程可以用扩散近似描述,具体形式为:
\[
St = S0 + (\pm g(\nut)\eta{SM}) t + \sqrt{\sigma^2 + \bar{\sigma}{SM}^2 + \varsigma{SM}^2} Wt
\]
其中,$\eta{SM}$ 是基于半马尔可夫状态转移与停留时间的漂移修正,$\bar{\sigma}{SM}, \varsigma{SM}$ 反映跳跃波动的扩散近似参量。[page::4, page::5]
- 霍克斯过程模型(Section 2.2):
- 价格跳跃由自激且聚集的霍克斯过程驱动,捕捉活跃度因先前跳跃激增的特点,符合市场突然爆发和连续跳跃的现象。
- 同样通过扩散近似,将复合霍克斯跳跃过程转化为具有附加漂移和扩散项的扩散模型:
\[
St = S0 \pm (g(\nut) \eta{HP}) t + \sqrt{\sigma^2 + \bar{\sigma}{HP}^2 + \varsigma{HP}^2} Wt,
\]
其中,$\eta{HP}, \varsigma{HP}$ 根据霍克斯过程参数(背景强度$\lambda$、响应函数积分$\hat{\mu}$等)定义。[page::6, page::7]
- 价格负值问题说明:
- 在跳跃-扩散模型中存在价格可能变为负数的隐患,但极端跳跃向单向累积才会发生,实际价格远高于跳跃尺度,故出现概率极低。
- 可采用指数跳跃-扩散模型避免负价情况,Guo et al. (2022)有所示范。[page::3]
3 随机最优控制(SOC)架构下的买入与清仓交易问题(Section 3)
- 主体流程:
- 代理商需在时间区间$[0,T]$以最优速率$\nut$买入或清仓目标持仓量$\mathfrak{N}$,避免一次性执行带来的冲击成本。
- 控制变量为交易速度$\nut$,动态影响库存$Qt^\nu$,受控价格$St^\nu$以及执行价格$\hat{S}t^\nu$。
- 交易价格包含永久影响(依赖速率的漂移项$g(\nu)$)和暂时影响(函数$f(\nu)$),并考虑持仓风险(库存惩罚项$\phi$)和执行约束(如买入价格上限、卖出价格下限)。
- 价格过程统一表达:
\[
d St^\nu = \pm (g(\nut) \eta) dt + \sqrt{\sigma^2 + \bar{\sigma}^2 + \varsigma^2} dWt,
\]
消除半马尔可夫/霍克斯区别以便统一建模。[page::8]
- 买入问题(Section 3.1):
- 代理需在$T$或价格触及上限$S{max}$前完成买入$\mathfrak{N}$单位,剩余部分在终止时按惩罚$\alpha$价买入。
- 价值函数由随机动态规划原理 (DPP) 导出,满足偏微分方程(DPE),最优交易速度通过平方完成法求得反馈形式。
- 关键简化:永久影响$b$设置为0(Almgren-Chriss常见做法),采用二次型终端和边界条件,使得DPE降维为仅时间和价格相关的函数$h(t,S)$的非线性PDE。[page::9, page::10, page::11]
- 清仓问题(Section 3.2):
- 结构与买入类似,但目标是在$T$或价格触及下限$S{min}$前卖出所有$\mathfrak{N}$单位。
- 价值函数及DPE形式类似,最优交易速率亦为反馈控制,表现为与剩余库存线性关联的函数。
- 同样设永久影响$b=0$简化。PDE的符号项在持仓惩罚和临界条件上略有不同。[page::12, page::13]
4 PDE数值求解(Section 4)
- 数值方案:
- 利用隐显式有限差分(IMEX)法求解买入、清仓问题中$h(t,S)$的非线性偏微分方程。
- 时间空间均匀网格,边界条件设为二阶导数为零,对应价格上下限。
- 模型参数取自MSFT实际LOB数据,并结合前期文献标定值,通过敏感性分析展示变参对策略的影响。
- 通过矩阵迭代形式计算数值解,确保稳定且高效。[page::13, page::14]
- 买入数值结果解读(Figures 2):
- 四个子图中,左上为纯扩散模型基线,右上加入半马尔可夫/霍克斯扩散模拟,底部两个逐步加大跳跃扩散波动$\varsigma$。
- 结果显示跳跃波动加持会使得在期初较低价格时代理购入速度加快,尤其接近期末和价格上限时交易更激进。
- 增加跳跃波动增加整体价格波动率,促使交易决策更积极前置执行,反映代理对跳跃风险的规避心理。[page::14, page::15]
- 清仓数值结果解读(Figures 3):
- 与买入问题对称,将价格上界替换为价格下界,边界条件对称调整。
- 增量式波动参数改变同样导致清仓速度提升。
- 价格跳跃下跌(对卖方不利)风险上升,代理加快清仓速度以规避低价风险。
- 总体数值解及交易策略变化与买入问题线性对应,参数调整透露跳跃效应核心影响市场冲击成本最优控制策略。[page::16, page::17, page::18]
5 策略仿真与性能分析(Section 5)
- 仿真设计:
- 利用标定后的跳跃-扩散模型,基于10000条随机价格路径模拟买入与清仓交易过程。
- 每个时步根据当前价格查找预先解得的最优交易速度,实现动态自适应交易。
- 模拟刷新现金、库存、执行价格,若触及边界停止,产生终端处罚。
- 买入策略结果(Figure 4-9):
- 价格路径展示不同跳跃扩散波动参数下市场价格的显著波动性差异,价格更频繁地达到价格上限,触发提前完成交易。
- 仓位路径和交易速度显示随着跳跃波动增加,代理倾向更快买入,且策略随路径波动更大,明显偏离经典Almgren-Chriss基线策略。
- 热力图显示累计交易量随时间的分布愈发集中,且出现更多提早完成交易的路径,反映跳跃风险提高了紧迫感。
- 清仓策略结果(Figure 10-15):
- 与买入问题类似,价格路径展示跳跃增强下更多价格触底事件,提前结束交易仿真。
- 仓位和交易速度动态随价格跳跃加剧波动明显,提高流动性风险感知与快速清仓的策略响应。
- 热力图再次体现强跳跃波动下清仓完成时间分布偏左,交易速度前期明显提升,远离纯扩散策略。
- 总体表现与买入问题形成策略上的对称且逻辑一致的跳跃风险管理响应。[page::18, page::23, page::26, page::27]
6 结论与未来展望(Section 6)
- 主要结论:
- 引入非马尔可夫跳跃成分(半马尔可夫、霍克斯过程),对此跳跃部分做扩散近似,使得模型既保留跳跃复杂性又便于SOC求解。
- 该更一般跳跃-扩散模型显著影响最优交易策略,跳跃波动越大,交易速度越倾向提前加快以降低跳跃风险。
- 仿真验证策略动态与经典扩散模型差异明显,且跳跃动态对于量化算法执行的实务指导意义重大。
- 模型扩展了传统纯扩散基线,有望推广到其它算法交易问题(做市、统计套利等)。
- 未来研究方向:
- 扩展更多市场情绪与周期下不同参数设置的敏感性分析。
- 结合强化学习(RL)或深度强化学习方法,规避传统SOC求解中维度灾难和模型局限。
- 尝试引入更一般的Levy过程,增加模型适用范围与跳跃刻画的灵活性。
- 目前模型基于扩散近似,完全跳跃模型数值破解仍存在挑战,RL或许为解决此类问题提供突破口。[page::27, page::28]
---
三、图表深度解读
图1:微软2012年6月21日9:30-10:30价格中位数演变(page::2)
- 描述:该图展示MSFT在高频时间刻度内价格的走势,明显体现价格的连续扩散波动与不定期的跳跃跳变。
- 解读:价格虽近似扩散,但多处跳跃(阶梯状上升/下降)显示无法用纯布朗扩散准确模拟。
- 关系文本:图中跳跃为底层模型需体现非马尔可夫跳跃性质的直接视觉证据,支持本文引入半马尔可夫及霍克斯过程建模的必要性。
---
图2:买入问题最优交易速度对时间与价格的热力图(page::15)
- 描述:四组子图分别在不同$\bar{\sigma}$和$\varsigma$(跳跃波动)参数下展示交易速度$h(t,S)$随时间和资产价格的演变。
- 解读:零跳跃情况下速度较平缓;跳跃波动增强使得交易速度在交易初期即显著升高,特别是在价格接近上限时,体现代理提前交易以规避高价风险。
- 关联结论:跳跃波动导致整体市场波动率增大,激发更激进策略,验证模型跳跃成分对策略影响的重要性。
---
图3:清仓问题最优交易速度热力图(page::17)
- 描述:类似图2但价格空间为从价格下限至初始价,展示清仓交易速度分布。
- 解读:跳跃波动增大使得在价格接近下限前代理加速清仓,规避价格骤降带来损失风险。
- 关系文本:与买入对称逻辑,突显跳跃风险提升交易紧迫感,模型合理且具有普适性。
---
图4 & 图10:价格路径样本(买入与清仓,page::19, page::24)
- 描述:展示在不同跳跃扩散参数下同一资产的5条随机价格路径。
- 解读:跳跃增强造成价格轨迹波动剧烈,更多触及价格边界(上限/下限)触发交易提前终结。
- 作用说明:为交易仿真提供现实基础,验证参数敏感性。
---
图5 & 图11:平均交易价格分布直方图(买入与清仓,page::20, page::24)
- 描述:10000次交易中代理买入或卖出的平均价格频率分布。
- 解读:跳跃波动提高使交易集中在更激进价格区间,展示交易成本的潜在增加或风险。
- 价值体现:体现模型实际交易水平,衡量策略绩效。
---
图6,7,12,13:库存与交易速度路径示意(买入与清仓,page::21, page::25, page::26)
- 描述:沿5条样本价格路径分别绘制代理库存与交易速率的动态变化,辅以Almgren-Chriss基准策略对比。
- 解读:跳跃增强使库存路径提前完成调整,交易速率更剧烈波动,体现模型响应市场跳跃风险的适应性调整。
- 意义:动态反映跳跃成分带来的策略启发和风险管理。
---
图8,9,14,15:库存与交易速度热力图(全样本买入与清仓,page::22,23,26,27)
- 描述:基于全部10000次交易的库存和交易速度轨迹热力图,以及策略均值曲线与AC基准对比。
- 解读:跳跃风险提升使平均交易行为曲线与AC基准逐渐背离,表现为更早完成交易和更前置的交易节奏。
- 结论:说明经过跳跃-扩散模型重塑的策略应对跳跃风险更灵敏,具备更高现实适用价值。
---
四、估值分析
本报告核心并非直接估值企业,而是提供资产价格动态模型及其对交易策略的影响。其估值思想主要体现在:
- 利用跳跃-扩散价格过程,该过程参数直接影响价值函数所满足的PDE系数(漂移、扩散项),进一步影响最优控制策略。
- 通过求解动态规划方程(DPE)衍生的PDE,倒推出最优交易速率反馈控制,实质为动态权衡价格风险、冲击成本和持仓风险的模型内隐“估值”。
- 扩散近似技术保证了跳跃过程在时间尺度放大后具备良好的数值解和收敛性,方便算法实施。
因此,报告的“估值”更多是通过交易策略最优化框架和对应价格动态实现价值权衡,没有采用经典DCF、P/E等企业估值方式。[page::4, page::5, page::6, page::9, page::10, page::11]
---
五、风险因素评估
报告主要隐含并讨论风险包括:
- 价格负值风险:跳跃幅度过大可能导致价格过程负值,虽现实可能性低但仍需关注,建议采用指数模型规避。
- 模型假设风险:
- 扩散近似依赖长时间尺度,可能失真高频极端跳跃事件。
- 永久影响$b$设为零简化,可能低估长期市场影响。
- 半马尔可夫和霍克斯过程参数标定误差引入策略误差。
- 市场环境变化风险:模型参数在不同市场状态下波动,策略需动态调整,否则可能失效。
- 数值解误差:有限差分求解非线性PDE存在稳定性和收敛性挑战,需细致调试。
报告建议结合深度强化学习等新技术应对上述风险,增强算法鲁棒性。[page::3, page::4, page::27, page::28]
---
六、批判性视角与细微差别
- 报告基于扩散近似解决跳跃跳变问题,固然便捷,但忽略纯跳跃型非连续路径可能导致局限,尤其在极端事件下模型表现或存偏差。
- 永久影响设为零欠缺一定的市场冲击认知,可能在涉及大量订单影响时存在不足。
- 模型与数值求解均假设所有随机过程独立,现实市场中跳跃间存在复杂相关性,影响跳跃风险的系统性。
- 报告强调模型适用于SOC框架,其他高级交易设置(如订单簿结构影响、对手方行为)未涉及,扩展空间仍大。
整体而言,报告的模型进步显著,但未来需考虑更复杂交易环境的动态耦合影响以增强适用度和稳健性。
---
七、结论性综合
该论文系统构建并实现基于半马尔可夫及霍克斯过程跳跃-扩散价格模型的算法交易问题,尤聚焦买入与清仓两典型情形。通过跳跃的扩散近似,建立统一价格过程:
\[
d St^\nu = \pm (g(\nut) \eta) dt + \sqrt{\sigma^2 + \bar{\sigma}^2 + \varsigma^2} dWt,
\]
参数$\eta, \bar{\sigma}, \varsigma$来源于半马尔可夫或霍克斯跳跃过程的统计性质。基于随机最优控制理论,革新交易价值函数PDE解法,设计反馈式最优交易速率,并利用有限差分法实现数值计算。
策略仿真涵盖10000条基于跳跃-扩散路径的交易示例,展示跳跃波动对交易速率提前化、库存路径调整以及执行价格分布的深远影响,对比经典纯扩散模型显著不同。高跳跃风险环境下,代理加快交易速度,规避价格跳跃带来的潜在损失或成本,体现其风险敏感的动态响应。
图形(图1、图2、图3、图4-15)深刻反映模型对价格跳跃特征的捕捉效果及交易策略调整,提供面向高频交易领域更精准的理论工具和实践参考。
整体上,报告创新性结合半马尔可夫和霍克斯非马尔可夫跳跃过程,填补了传统跳跃扩散不足,验证了跳跃模式对执行交易策略的实质增强,具有显著学术价值和行业应用潜力。
未来方向建议拓展至多市场环境、多资产组合及强化学习方法,克服模型与数值局限,提升智能算法交易的适应力与鲁棒性。[page::0~28]
---
附:报告关键图像引用(部分)
- 图1 - MSFT中位数价格走势示例:

- 图2 - 买入问题最优交易速率热力图:

- 图3 - 清仓问题最优交易速率热力图:

- 图4 - 买入价格路径示意:

- 图5 - 买入平均交易价分布:

- 图6-7 - 买入库存与交易速率曲线:


- 图8-9 - 买入全样本库存及交易速率热力图:


- 图10-15 - 清仓部分对应图示(价格路径、平均价、库存、交易速率及其热力图)
---
总结
本报告标志着高频算法交易领域对非马尔可夫跳跃现象的深入理论建模突破,完美融合半马尔可夫与霍克斯跳跃建模优势,结合扩散近似与随机最优控制,提供了一个既理论严密又实践适用的交易策略设计框架。各种策略敏感性仿真验证了跳跃成分对交易行为和执行成本的决定性影响,为未来智能算法设计及风险管理提供了坚实的数学基础和实践指引。
---
(全文字数约2200字,全面覆盖报告核心内容、模型理论、数值方法、实证仿真、关键图表与未来展望。)