`

Market Simulation under Adverse Selection

创建于 更新于

摘要

本报告针对高频交易中的市场做市策略,深入研究了成交概率和不利成交(adverse fills)对策略模拟表现的影响。通过对CME最活跃的四种期货合约(ES、NQ、CL、ZN)的实证分析,揭示了忽略不利成交会导致策略表现被系统性高估的问题,提出了结合不利成交和现实成交概率的改进仿真框架,以更贴近真实交易环境的风险与收益评估 [page::0][page::1][page::5][page::15][page::20][page::21]。

速读内容

  • 研究背景及问题定义 [page::0][page::1]:

- 探讨市场做市商(Market Maker, MM)策略中限价单(Limit Order, LO)和市价单(Market Order, MO)的成交概率及不利成交现象。
- 利用CME期货合约ES、NQ、CL、ZN的LOB快照及历史数据,计算成交量、中位成交量,分析限价单队列深度和成交频率。

- 不利成交定义为限价单成交后紧接价格向对做市商不利的方向变动,即持仓市值立即产生负向变动。
  • 文献综述强调 [page::3][page::4]:

- 高频交易文献多假设成交与价格过程独立,忽视不利成交的系统风险,导致业绩高估。
- 最新研究首次尝试量化不利成交的概率和影响,但未能有效整合至交易策略仿真。
- 本文提出的填充比例进行区分(非不利成交概率ρ,明确建模非不利成交),并结合实时LOB数据,补足现存模型不足。
  • 不利与非不利成交示例及实证数据 [page::5][page::6][page::7][page::9]:

- 通过简单市场做市策略仿真,利用随机游走价格模拟,明确区分不利填充(红点)和非不利填充(绿点)的时间点与价格走势。

- TT仿真平台数据对实际一交易日LO填充结果进行统计,发现多数填充为不利填充,具体见下表:

| 日期 | 合约 | 总LO填充数 | 不利填充数 | 非不利填充数 |
|------------|--------|------------|------------|--------------|
| 2024/04/24 | ES Jun24 | 941 | 767 | 174 |
| 2024/04/25 | NQ Jun24 | 1929 | 1269 | 660 |
| 2024/04/23 | CL Jun24 | 625 | 518 | 107 |
| 2024/04/24 | ZN Jun24 | 224 | 199 | 25 |
  • Stochastic Optimal Control (SOC)市场做市模型拓展 [page::9][page::10][page::11][page::12][page::13]:

- 以Cartea等(2015)的SOC MM问题为基础,拓展引入非不利成交概率ρ调整策略控制变量。
- 状态变量包括中价S,短期alpha因子α,库存Q,现金C,MO到达过程等。
- 动态规划方程(DPE)中以期望收益最大化为目标,结合非不利成交概率调整订单发布阈值,实现最优策略。
- 模型中因降维处理无法显式加入不利成交,需在仿真环境通过数据分离来补充分析。
  • 仿真环境设计与改进 [page::14][page::15][page::16]:

- 基准环境依据Cartea et al. (2015)和Jaimungal (2019),假设所有成交均为非不利,且交易订单均排在队首。
- 改进环境引入基于实证的非不利成交概率ρ(取值约0.2),并显式追踪不利成交事件,使填充过程更符合真实市场规则。
- 采用真实LOB数据与1秒重采样,结合非均匀事件驱动的LO、MO流程进行交易策略仿真。
- 定义非不利成交计数与不利成交计数公式,确保成交数量守恒。
  • 策略结果对比及影响分析(以CL合约为例) [page::17][page::18][page::19][page::20]:

- 最优策略发单决策不同ρ值影响明显,ρ从1下降至0.2使得发布阈值更严格,发单条件收紧。

- 120秒随机路径下的策略执行及成交情况对照,改进环境显示大量不利成交填充点(AFA、AFB),发单及库存变化较基准更谨慎。


参数示范(主要参数节选):

| 参数 | 值 | 参数 | 值 |
|-----|----------|-----|------------|
| T | 120秒 | dt | 1秒 |
| ρ | 0.2 | Δ | 0.01 |

- 多次仿真累计填充统计:

| 填充类型 | 数量 |
|----------|-------|
| AFA | 3950 |
| NFA | 825 |
| AFB | 3943 |
| NFB | 813 |

- 对应随机路径的资产净值及库存动态显示明显差异,改进环境净值表现大幅下降,库存波动更低。

- 330次仿真终值分布对比,基准环境收益分布明显右偏,改进环境贴近真实表现风险更高且整体盈亏下降。
  • 多标的策略仿真结果(ES、NQ、ZN)及补充图示见附录 [page::25..28]:

- 各标的均表现出高比率不利成交,尤其是NQ和ES不利填充总数远超非不利填充。
- 多标的净值和库存路径对比表明基准环境均显著夸大策略表现。





| 填充类型 | ES数 | NQ数 | ZN数 |
|----------|-------|--------|--------|
| AFA | 5804 | 11509 | 389 |
| NFA | 2107 | 1963 | 1960 |
| AFB | 5780 | 11448 | 432 |
| NFB | 2088 | 2009 | 1999 |
  • 结论与展望 [page::21]:

- 传统模型独立模拟成交和价格路径,忽视不利成交导致策略业绩虚高,需引入不利成交与非不利成交概率区分。
- 建议未来模型引入订单簿队列动态、多样化MO尺寸、非均匀发单策略、基于深度学习的填充概率估计以及更复杂价格跳跃过程模型。
- 在SOC框架内,短期alpha预测工具虽能提升效果,但其市场适应性弱,难以避免大部分不利成交。
- 改进仿真环境为策略评价提供更接近实盘的风险收益判断基础,有助于高频量化策略的有效开发与风控 [page::0][page::6][page::21]。

深度阅读

市场模拟中的逆向选择影响——一份详尽分析报告剖析



---

一、元数据与报告概览



报告标题:Market Simulation under Adverse Selection
作者:Luca Lalor 与 Anatoliy Swishchuk
机构:University of Calgary,数学与统计系
发布日期:2025年4月1日
主题:针对市场做市(Market Making)策略中,考虑逆向选择(Adverse Selection)及成交概率对高频交易模拟的影响,基于CME交易所四个主流期货品种的实证研究。

核心论点及贡献
本报告关注于高频交易(HFT)中市场做市策略的仿真评估,特别强调了在模拟过程中准确考虑成交概率(Fill Probability)与逆向成交(Adverse Fills)对策略性能影响的重要性。作者指出,许多以往研究忽视了成交价格与订单执行之间的依赖关系,导致模拟性能被高估。通过引入更真实的成交概率模型和逆向成交追踪,报告构建了一个更加谨慎且贴合实务的模拟框架,验证了这些因素对策略性能的实质性影响。最终,报告以四个流动性较好的CME期货合约数据进行实证检验,强化了结论的广泛适用性。[page::0][page::1][page::2]

---

二、逐节深度解读



1. 引言



作者介绍了算法交易和高频交易已成为主流,策略通过市场订单(Market Orders,MO)和限价订单(Limit Orders,LO)完成交易。市场订单即时成交以最佳价格,而限价订单则存放在限价订单簿(LOB)中直至成交或撤销。文章第一节通过ES合约的LOB数据直观展现了限价订单簿结构,并定义了两个关键概念:
  • 成交概率:限价单被执行的可能性,受订单簿中队列位置、价格深度及市场订单到达频率和规模影响。

- 逆向成交:被动做市商的限价单成交于不利价格,导致成交后仓位即刻显露亏损。

通过竞价单子与成交量的对比(表1),确认研究对象为流动性最高的四种期货:ES、NQ、CL、ZN。对逆向成交的强调,指出其普遍性和不可避免性,并提出将其融入模拟环境的必要性。[page::1][page::2]

---

2. 文献综述



综述涵盖了文献中围绕成交概率和逆向选择的不同建模方法和应用,强调现有高频市场做市模型多运用随机最优控制(SOC)框架。引用了Bulthuis等(2017)、Cartea等(2018)、Roldan Contreras和Swishchuk(2022)等开创性工作,阐述了LOB价格影响、交易信号和订单流的统计与随机过程模拟。此外,指出预测市场订单流的模型虽然先进,却难以捕捉短时间内突发的高频订单流震荡,导致实际逆向成交难以有效预测。作者还提出,尽管已有研究关注逆向成交风险,但并无研究明确区分逆向与非逆向成交填充,这种区分对理解策略性能尤为重要。特别是引用新近的DeLise(2024)实证发现,逆向成交在ZN合约中占多数,强化了本研究的必要性。[page::3][page::4]

---

3. 逆向与非逆向成交的区分



本节揭示当常用模拟假设价格过程与市场订单独立时,逆向成交常被忽略,导致收益表现被高估,因模型未能展现成交与市场价格动态真实的耦合。通过实际1秒级别LOB数据和两种示例演示真实的成交特征:
  • 示例1(简易市场做市商模拟):LOB维持固定价差,订单队列前端始终全额成交,成交被标记为逆向或非逆向,图2展现这两种成交的交替出现,强调两种成交性质的不同及其对资金评估的影响。[page::5][page::6]
  • 示例2(基于真实模拟环境TT平台):采用实盘仿真,策略通过定价间距发出限价单,根据价格变化判定逆向成交。实证数据表明所有品种中,逆向成交占比较高(例如ES逆向成交占总成交的约82%),显示策略执行中逆向成交不可规避且频繁出现。[page::7][page::8][page::9]


这两点验证了模拟中若不准确体现逆向成交,策略表现将严重偏离现实。

---

4. 随机最优控制(SOC)市场做市问题建模



本节以Cartea等(2015)的SOC市场做市模型为基础,其中控制变量为是否在最优买价/卖价位置挂单,订单单位均为1。引入了一个改进的非逆向成交概率$\rho$以反映现实成交概率,说明:
  • 价格过程$St$服从带漂移(长期$\nu$和短期瞬时波动$\alphat$)和布朗运动的随机微分方程,且$\alphat$受市场订单到达跳跃影响,模拟订单流对价格趋势的反馈。

- 发起订单的成交计数过程$N
t^{\delta,\pm}$依赖控制策略$\delta$和市场订单到达。
  • 现金过程$C_t^\delta$与成交价格密切相关,包含价差因素$\Delta$。

- 优化目标是最大化期末财富,考虑库存风险惩罚$\phi$,保持仓位适度。

关键SDE及动态规划方程(DPE)详尽给出,实现了对订单执行时机和价格变动之间动态的数学刻画。同时,作者指出由于模型简化时去除价格状态$S$,无法直接考虑逆向成交,只能在模拟环境中引入该因素进行补充分析。此外,最优控制中的成交概率$\rho$被重新定义为针对非逆向成交的概率,[page::9][page::10][page::11][page::12][page::13]

---

5. 交易模拟环境设计



本节介绍基准模拟环境(Cartea et al. 2015, Jaimungal 2019)的更新版本,以真实LOB数据替代模拟价格,实现更接近实盘的表现评估。显著改进包括:
  • 引入真实市场LOB数据,采用1秒时间粒度,使用前向填补法(forward fill)处理缺失数据,保证数据连续。

- 基准假设所有成交均为非逆向,且假设均在队列前端,现实中极不合理。
  • 引入非逆向成交概率函数$\rho$,结合队列位置和订单流统计,统计得出合理的$\rho$值(如0.2),使成交概率更贴近实际。

- 用新的计数过程区分逆向和非逆向成交,依据价格是否越过挂单价位来追踪逆向成交的发生。
  • 结合Mohs模型,将非逆向成交和逆向成交计数合并,保证估计全面。


该改进显著改变了订单执行的动态,模拟过程中动态反馈至库存及现金变化,影响整体策略效果评估。[page::14][page::15]

---

6. 模拟结果分析



作者以CL合约为主案例,基于330次独立模拟路径比较基准与改进模拟环境下的表现,主要发现包括:
  • 最优策略表现(图3):当非逆向成交概率$\rho$从1降至0.2时,策略趋于更加谨慎,降低了挂单频率,特别是在库存较低时,反映成交概率信息对策略控制的影响。
  • 成交时间序列与填充情况(图4):改进环境中,价格穿透挂单必饱和成交,展示了大量逆向成交发生(标记为AFA、AFB),与基准环境中成交与价格过程独立假设形成鲜明对比。此现象导致库存进出路径更加复杂,交易互动更丰富。
  • 统计填充数量(表4):逆向成交数量远超非逆向成交,符合先前实证表2,验证改进方法的现实适应性。
  • 财富和库存路径变化(图5):基准环境财富呈稳健增长,改进环境则明显较差,库存波动幅度较小,指示策略表现盛气凌人地被基准环境高估。
  • 终局P&L分布(图6):策略在基准环境多呈正收益,改进环境则多数模拟亏损或微利,证实逆向成交及合理执行概率极大压缩策略收益,避免“幻影利润”出现。


此结果充分体现了忽视逆向成交和非现实成交概率风险导致策略表现被严重高估的风险,强调在仿真和风险评估中考虑这些因素的必要性。[page::16][page::17][page::18][page::19][page::20]

---

7. 结论与未来方向



总结指出,本文模拟强调了逆向成交与非逆向成交概率对市场做市策略性能评估的基础性影响,针对MM策略大量发布限价单的特性,警示普遍存在的模型简化对性能评估产生的幻觉性增益。逆向成交基本无法避免,即使有短期alpha预测器,现实中大额订单随机涌现使其极难准确预测。未来研究建议包括:
  • 构建动态MM模型,实时调整参数,模拟市场订单大小变化和簇集效应,以更细致地刻画成交概率及逆向成交分布。

- 探索基于深度学习(如卷积和变压器结构)估计成交概率的新方法,实现非静态、非线性的订单行为模拟。
  • 加强短期alpha预测器性能研究,提升逆向成交的预测和规避能力。

- 引入更先进的价格过程建模,如跳跃扩散或Levy过程,更符合LOB价格动态。

总之,报告为市场仿真领域提供了重要的建模改进视角和实证验证,为高频及算法交易绩效评估提供更坚实且现实的基准。[page::21]

---

三、图表深度解读



表1:四个CME期货合约均值及中位成交量



| 合约 | 平均成交量 | 中位成交量 |
|----|-------|-------|
| ES | 3.47 | 1 |
| NQ | 1.54 | 1 |
| CL | 1.70 | 1 |
| ZN | 16.01 | 2 |

该表显示四个品种不同的交易行为,尤其ZN成交量明显高于其他合约,中位数偏低显示存在大量小成交,影响路径模拟中订单簇集及成交概率的设定。[page::2]

---

图1:ES期货合约的LOB快照(2024-04-24)



图形用横向条形描述买卖盘数量与价格层级,卖盘(红色)买盘(绿色)数量明显波动,最深流动性集中于特定价格点。该图辅助理解LOB深度对订单执行概率的直观影响,也映射成交阻力层级。[page::2]



---

图2:简易MM策略逆向与非逆向成交展示



蓝线和黄线分别为买卖价,绿点与红点代表非逆向与逆向成交的位置与时间,绿色点更多出现在价格相对稳定或有利时,红点多出现在价格快速穿透订单时。该直观图示强调了成交类型对实际盈亏的影响,是理解逆向成交概念的基础视图。[page::6]



---

图3:MM策略最优控制解($\rho=1$和$\rho=0.2$时)



三维图展示时变、短期价格动量$\alpha$和库存$q$对最佳买卖挂单策略的影响。$\rho=0.2$情形下较低的非逆向成交概率使拟合策略更加谨慎,收敛于保守持仓。此表明成交概率在控制策略中的敏感作用,直接影响策略挂单积极性。[page::17]



---

图4:120秒内策略执行快照对比(Benchmark与改进环境)



左图模拟成交与市场价格独立,MOs未必覆盖价格穿透情形,成交标识均为非逆向成交(红、黄点)。右图显示改进模型严格跟踪逆向成交(AFA, AFB)及非逆向成交,逆向成交数量显著增加,影响挂单策略频率和库存状态。该图明确反映两者对成交时序的显著差异。[page::18]



---

表4:改进模拟下逆向与非逆向成交统计(330次模拟)



| 成交类型 | 数量 |
|-------|-------|
| AFA | 3950 |
| NFA | 825 |
| AFB | 3943 |
| NFB | 813 |

逆向成交比例远超非逆向,验证真实市场成交特征及模型改进的合理性。[page::19]

---

图5:同一120秒路径下财富与仓位演变



左图(基准)财富明显增长,库存波动较大;右图(改进)财富多为波动下滑趋势,库存变动幅度更小且节奏不同。因逆向成交增加,策略收益稳定性受损,反映了真实成交环境的风险敞口提升。[page::20]



---

图6:终局现金分布



基准环境(左)较多模拟获得正收益且分布较集中,改进环境(右)收入多近零或负值,尾部风险集中,表明模型中低非逆向成交概率和逆向成交对策略收益弹性产生极大影响。[page::20]



---

附录图7-10及表5



分别展示了ES、NQ、ZN合约的模拟策略快照、资产财富和仓位路径及终局收益直方图,均反映了与CL类似的趋势:基准环境中策略表现较好,改进环境策略收入明显下降,逆向成交比例大幅增加。附表5详细统计了三合约逆向与非逆向成交数值,强化了上述结论的普遍性。[page::25][page::26][page::27][page::28]

---

四、估值分析



报告的核心并不是传统意义上的公司价值估值,而是针对市场做市策略的收益与风险进行模拟绩效评估。尽管模型中涉及动态规划和随机控制,其中重点在于带有非逆向成交概率的动态控制策略优化。作者引入非逆向成交概率参数$\rho$,并证实该参数大幅影响最优挂单决策,进而影响总收益分布。

该研究没有直接运用DCF或市盈率等传统估值方法,而是通过模拟演化的现金和库存过程,依据策略最终现金状况作策略价值的间接估计。非逆向成交概率降低对应的是策略对挂单行为的谨慎化,策略收益随之下降,因为成交机会和正向盈利机会减少,同时逆向成交导致的亏损增加。

整体而言,本研究的估值方法是在SOC框架下结合非逆向与逆向成交概率的交易绩效模拟分析,而非传统企业估值,强调模型现实层面调整对风险-收益关系的深刻影响。[page::12][page::13][page::16][page::17]

---

五、风险因素评估



报告识别并分析的主要风险因素包括:
  • 逆向成交风险:出售或购买的限价单被成交于市场价格反向变动后的位置,导致立即亏损几率,尤其在高频快速价格变动下极难规避。

- 成交概率不确定性:除逆向成交以外的非逆向成交概率低于理想状态,因排队机制、市场订单到达变动和撮合效率等因素影响,导致成交机会减少。
  • 模型简化风险:价格状态变量$S$在结构化简时被省略,妨碍逆向成交的直接建模,只能靠后期模拟补偿,存在建模局限。

- 短期Alpha预测不完备:用于捕捉未来价格跳变的alpha预测过于简化,难以真实反映复杂高频市场行为,导致逆向成交预测能力不足。
  • 数据与策略依赖性:基于特定期货合约和固定参数的实证,模型跨市场通用性和适应性存在不确定性。


报告建议未来研究通过动态参数调整、深度学习估计成交概率等方式减缓风险影响,且实务中关于极端市况下策略表现的风险无法完全排除。[page::21]

---

六、批判性视角与细微差别


  • 模型假设的局限性:尽管引入非逆向成交概率$\rho$,仍假设成交边界操作较为刚性。实际中,订单簿排队动态更复杂,且各种微观结构性因素可能导致更复杂的成交风险分布。

- 逆向成交统一定义问题:逆向成交按价格跃迁立刻判定,忽视了市场微观结构中可能的价格滑点和成交价格离散性,估计可能偏保守。
  • 短期Alpha预测的简单化:使用Cartea et al.提供的alpha模型该模型过于简单,忽略了高频数据中的非线性与结构性依赖,影响模型预测逆向成交的能力。

- 实证数据有限:实验主要基于单日数据及有限合约,可能无法代表长周期市场状态或其他资产类别的动态。
  • 忽略部分市场微观因素:如订单取消率、隐藏订单机制等在模型和模拟中均未纳入,可能导致模型与实务仍有差距。


---

七、结论性综合



本报告深入剖析了高频市场做市策略在包含逆向成交和真实成交概率条件下的性能表现,针对标准SOC模型的局限,系统构建了融合逆向成交逻辑的改进仿真框架。实证基于CME四个最活跃期货合约ES, NQ, CL, ZN,综合发现:
  • 逆向成交普遍且不可避免,交易策略中绝大多数成交均为逆向,放大了交易损失与风险敞口。

- 非逆向成交概率远低于理论理想值,导致策略挂单积极性被显著抑制,优化控制策略更为谨慎。
  • 传统基准模拟中忽视逆向成交及以成交概率为1的假设导致策略收益被严重高估,错失潜在风险。

- 引入逆向成交计数与现实非逆向成交概率后,策略盈利显著降低,收益分布更符合现实交易竞争环境。
  • 报告提供了一条研究路径,通过引入真实成交概率和逆向成交计数,为策略评估与设计提供更贴近市场的工具。


图表深度解读清晰揭示,真实LOB数据驱动模拟与基准模拟形成显著差异,策略在现实条件下面临沉重挑战。本研究强调了高频交易中考虑市场微观结构实际动态、精准刻画成交风险的重要性,促进了算法交易策略更真实有效的评估。

综合来看,作者呈现的是一个在经典SOC框架基础上,结合LOB真实动态引入逆向成交风险及成交概率修正的高频市场做市策略性能模拟研究,为今后相关方法的完善和实战策略的设计提供了坚实理论和实践基础,具有重要的参考价值和学术贡献。[page::0][page::1][page::2][page::5][page::9][page::14][page::16][page::20][page::21]

---

参考图片索引


  • 图1 LOB快照:

- 图2 简单MM逆向与非逆向成交说明:
  • 图3 最优策略$\rho=1$与$\rho=0.2$对比:

- 图4 策略执行快照对比(Benchmark vs Improved):
  • 图5 财富与库存路径对比:

- 图6 终局现金分布直方图:

---

以上为本报告的极其详尽和全面分析,涵盖了报告的所有关键论点、数据和图表解析,充分展现了逆向成交及真实成交概率引入对高频市场做市策略模拟和性能评估的重大影响。

报告