`

Market Making with Exogenous Competition

创建于 更新于

摘要

本报告研究了在外部竞争影响下的做市商流动性提供问题,构建了一个考虑竞手库存的线性-二次最优控制模型,推导出近似闭式最优策略,并通过数值仿真和强化学习算法对比验证其有效性,揭示了做市商在管理自身库存风险与应对竞手未成交订单之间的权衡关系 [page::0][page::1][page::8][page::10].

速读内容

  • 研究背景与模型设定 [page::0][page::2][page::3]:

- 引入一个“参考做市商”模型,考虑对多个竞手的汇总库存影响,假设竞手依据线性规则调整报价深度。
- 模型中做市商报单深度对成交概率呈指数衰减,成交概率取决于参考做市商与竞手报价深度的差异。
- 竞手报价深度线性依赖于其库存并叠加噪声项,维持恒定买卖差价。
  • 优化目标与求解方法 [page::4][page::5][page::6][page::7]:

- 参考做市商通过最大化线性-二次型收益目标函数,权衡库存清算成本与交易收益。
- 利用动态规划,构建及简化Hamilton-Jacobi-Bellman方程,并采用线性-二次近似方法求解。
- 推导出相关矩阵常微分方程,得到近似闭式解,表现为一个带权重的矩阵指数形式。
- 最优买卖报价通过模型中的库存和噪声状态动态调整,并保证相较于竞手报价的“慷慨度”至少为一个tick。
  • 数值实验及特征分析 [page::8][page::9]:

- 优化深度随自身库存变化展现调节趋势,增加库存促使做市商更慷慨地调整卖价并限制买入,竞手库存对交易深度有相反影响。
- 数万次蒙特卡洛模拟表明,参考做市商极少数情况下会“优于”竞手报价,且会迅速因库存变动调整报价。
- 交易报价差距随着库存变动规律性波动,临近交易结束时趋于收敛。


  • 近似解与数值基准及强化学习的对比 [page::10]:

- 将闭式近似解与基于Euler方法的离散求解和PPO强化学习策略性能进行了比较。
- 发现近似闭式解接近Euler数值解,二者均优于当前强化学习算法,后者的表现可能因参数未充分调优而受限。
- PPO学习的策略显示出与闭式解相似的定价曲线趋势。
  • 研究贡献与结论 [page::10]:

- 本文首次考虑竞手未成交订单对市场成交概率及做市商最优报价策略的影响。
- 提出能够兼顾自身库存风险与外部竞争条件下报价优化的有效模型及近似求解方法。
- 数值仿真和强化学习对比验证模型合理性及策略优越性,为算法交易中做市商策略设计提供理论依据。

深度阅读

金融研究报告详尽分析 —《Market Making with Exogenous Competition》



---

1. 元数据与概览


  • 报告标题: Market Making with Exogenous Competition

- 作者: Robert Boyce, Martin Herdegen, Leandro Sánchez-Betancourt
  • 机构: Imperial College London、University of Warwick、University of Oxford及Oxford-Man Institute of Quantitative Finance

- 发布日期: 未明确给出,但文献引用截至2024年初
  • 主题: 高频交易中的做市商策略建模,重点研究在存在外部竞争的情况下做市商的流动性提供及最优报价策略。

- 核心论点与目标:
报告建立了一个扩展Avellaneda-Stoikov模型的框架,研究一个“参考做市商”在面对采用规则性线性报价策略的竞争对手时,如何动态调节自己的报价深度以最大化交易收益并管理库存风险。核心创新点在于考虑其他做市商的影响,尤其是未被参考做市商成交的订单将被竞争对手成交,从而间接影响后续报价的填充概率。文中明确给出了该模型的近似闭式解,并通过数值模拟、Euler方法和强化学习进行验证比较。[page::0,1]

---

2. 逐节深度解读



2.1 引言(Introduction)


  • 关键信息:

作介绍高频交易中做市商如何通过限价单薄提供流动性,平衡赚取买卖价差和库存风险的问题。传统文献如Avellaneda-Stoikov(2008)提出基于Poisson过程的到达率假设和指数填充概率模型,但未充分考虑多做市商间的竞争互动。该文创新提出关注未被参考做市商成交的市场订单将被竞争者成交,进而影响市场条件及未来成交概率。
  • 逻辑推理:

多做市商竞价会动态调整订单深度,影响整体订单流分布,对单一做市商策略形成挑战。作者拟定一个可聚合竞争者的规则性线性策略模型以简化竞价结构,继而构建更具现实意义但又相对可解的最优策略框架,从而反映了流动性提供中的竞争影响。[page::0,1]

---

2.2 模型设定(Section 2)


  • 关键信息:

- 基础资产价格模型: 服从几何布朗运动,$St = S0 + \sigma Wt$,其中$Wt$是Brownian运动。
- 参考做市商控制变量: bid/ask报价深度$(\delta^b, \delta^a)$,均为可预测、积分有限的过程。
- 竞争做市商策略: 采用规则性线性函数,基于其持仓库存$\tilde{Q}t^\delta$定义报价深度,含噪声项$Zt$,即
$$
\tilde{\delta}t^{a} = \tilde{a} - \beta \tilde{Q}{t^-}^\delta - Zt, \quad
\tilde{\delta}
t^{b} = \tilde{b} + \beta \tilde{Q}{t^-}^\delta + Zt,
$$
其中$\tilde{a}, \tilde{b}, \beta, \sigmaZ$为正参数,$Zt = \sigmaZ Wt^Z$是独立布朗运动产生的噪声。
- 订单到达及填充概率: 市场订单(买卖)以Poisson进程模型到达,参考做市商的订单被成交的概率以指数函数形式表示,且依赖于相对竞争者报价深度的差值。例如
$$
\Lambda^{a} = \lambda^{a} \min\left( \exp\left( -\kappa(\delta^{a} - \tilde{\delta}^{a} + \iota) \right), 1 \right),
$$
其中$\kappa$是指数衰减率,$\iota$为tick size。若参考做市商报价比竞争对手更“慷慨”宽松(少一个tick),则成交概率为1。
- 库存限制: 设定上、下库存边界,边界处报价做相应限制。
- 目标函数: 为线性-二次形式,综合考虑现金余额、最终库存标价、终端库存惩罚和持有成本惩罚。
  • 逻辑及假设:

- 通过规则性线性机制简化竞争对手多体系统为单一体竞争对手,便于分析。
- 指数填充概率结合了相对报价深度的动态竞争影响。
- 目标函数设计兼顾获利与风险控制,常见且数学上易求解。
  • 数学表达清晰,核心变量之间关系明朗,为后续优化奠定基础。[page::2,3,4]


---

2.3 最优策略的推导(Section 3)


  • 核心目标:

最大化目标函数的期望——通过动态规划,求解满足Hamilton-Jacobi-Bellman(HJB)方程的价值函数。
  • HJB方程结构:

涉及价值函数对时间、价格、现金、库存以及竞争对手库存和噪声变量的偏导,包含市场订单填单事件的跳跃项和对应最优报价决策部分的极大化操作。
  • 线性二次解构假设与变量变换:

作者采用线性-二次函数形式的推测,设定
$$
u(t,s,x,q,\tilde{q},z) = x + q s - \frac{\beta}{2} q^2 - \beta \tilde{q} q - z q + g(t,q),
$$
并通过定义调整过的报价深度差$c^a, c^b$简化优化问题。
  • 优化结果及反馈形式

对$c^a, c^b$的显式最优解涉及对函数$g$的前后差分,通过指数填充概率的形式显式解得。
  • 近似闭式解路径:

假设无约束最大化器与竞争对手报价深度差满足一定关系(无约束最大化器不小于竞争对手深度),将HJB约化为矩阵常微分方程(ODE)形式,进而通过对矩阵指数计算得到$\omega(t,q)$函数,再由$\omega$反映回价值函数和最优报价策略。
  • Theorem 3.1陈述了该系统行列式矩阵的构造与最终最优控制表达式。

- 数学术语解释:
- HJB方程为动态最优控制的必要条件,反映最优价值函数的演化。
- 线性-二次模型降低复杂度,使问题转化为求解ODE矩阵指数。
- 反馈形式则保证策略随状态动态调整。
  • 该节为理论主体部分,通过数学变换与假设,规避了高维非线性PIDEs求解难题,实现模型实用化并保留竞争动态特征。[page::4,5,6,7]


---

2.4 数值比较与模型表现(Section 4)


  • 参数设置:

- 初始价格$S0=100$,波动率$\sigma=1$,交易时长$T=1$(单位未明,可能为日内小时)。
- 到达率$\lambda^a=\lambda^b=10$,库存边界$\pm 10$。
- 竞争者基线报价深度$\tilde{a}=\tilde{b}=0.1$,线性系数$\beta=0.05$,衰减速度$\kappa=2$,tick size$\iota=0.01$。库存惩罚$\phi=0.1$,终端惩罚$\gamma=0.03$。
  • 图1解读:

- 左图展示最优买卖报价深度$\hat{\delta}^a, \hat{\delta}^b$随参考做市商和竞争对手库存的关系。
- 主要结论:参考做市商库存越大,卖价越慷慨(报价更低),买价越严格(报价更高),以清理库存;对手库存越大,其报价相反,影响参考做市商的报价调整。
- 竞争报价边界以红线表示,实际报价为二者的最大值。
- 右图展示随着时间临近终端,做市商减少报价差异,逐步平衡风险。
  • 模拟与概率:

- 在1万个模拟中,参考做市商只有13次报价超过竞争者,表明其策略较为保守,除非仓位压力大。
  • 图2与图3解读:

- 图2展示单次特例,参考做市商在负库存压力下短暂提高报价优势,以快速调整仓位。
- 图3显示两个示例路径的库存、噪声、报价及其差值,直观呈现策略如何随环境波动和自身/竞争库存动态调节价格。
  • 模型验证:

- 对比Euler差分和强化学习算法结果,近似闭式解性能优异,仅比Euler方法低0.5%的表现,后者具统计显著性优势。PPO强化学习结果表现较低,可能因模型参数或训练限制,但与传统数值方法表现接近。
  • 图4展示PPO策略与学习过程,强化学习虽实用,但结合近似闭式解具有更稳定和优异的表现。[page::8,9,10]


---

2.5 结论(Section 5)


  • 总结:

作者成功构建了一个考虑外部竞争影响的多做市商高频交易模型,合理地反映了未成交订单转移带来的策略动态,给出近似闭式最优报价策略,并且通过数值和强化学习方法验证其有效性。
  • 贡献点:

- 引入竞争者的影响,丰富市场微观模型。
- 算法具备实际应用价值,能指导交易策略设计。
- 强化学习与经典动态规划的结合展示金融机器学习的实际潜力。
  • 未来方向暗示: 可用更复杂动态博弈方法扩展或考察模型在多资产、不同市场结构下的表现。 [page::10]


---

3. 重要图表深度解读



图1(第8页)


  • 内容:

- 左图:参考做市商最优买入卖出深度$\hat{\delta}^a, \hat{\delta}^b$于时间$t=0.5$,不同参考和竞争者库存状态下的曲线。颜色映射参考做市商库存水平。
- 右图:不同时间和参考做市商库存下最优深度变化。
  • 趋势与解读:

- 参考做市商库存越高,其卖价更慷慨(降低报价加快卖出),买价更严格,配合库存管理。
- 竞争对手库存影响报价反向调节,显示二者库存动态互为制约。
- 时间临近终端,报价波动缩小,风险规避加强。
  • 文本联系: 这支持模型中库存风险和竞争级别共同决定报价策略的核心观点,定量体现了竞价压力和风险制衡。[page::8]



---

图2(第9页)


  • 内容:

- 参考做市商与竞争对手竞价随时间的动态,以及库存变化。红色表示做市商报价优于竞争者的区域。
  • 意义:

- 罕见的情境中,参考做市商被负库存压力驱动,积极出价超过竞争对手,展示模型在极端情况下的灵活性。
  • 联系文本: 佐证仿真中极端策略罕见但确实存在,验证报价调整机制合理且富有弹性。[page::9]



---

图3(第9页)


  • 内容: 两条轨迹样本,库存、噪声过程、报价深度及报价差异,配以买卖成交标记。

- 趋势与解读:
- 噪声$Z
t$对竞争者报价影响显著,进而影响参考做市商报价。
- 报价差异受库存变化动态调节,仓位调整过程中报价持续调整反映风险管理。
- 成交点与报价动态相符,验证模型的动态反馈机制。
  • 文本联系: 展示模型中报价对市场状态和噪声因子的敏感反应,说明该模型在高频交易复杂环境下的适应能力。[page::9]



---

图4(第10页)


  • 内容:

- 左图:PPO强化学习算法学习的买卖报价策略随竞争者库存的变化。
- 右图:PPO训练过程中的平均回报变化,与闭式解和Euler方法基准比较。
  • 解读:

- PPO策略在结构上与理论最优策略相似(报价排序、方向),表明强化学习在此问题上的有效性。
- 训练奖励趋于稳定,但略低于经典方法,显示闭式方法性能更优,强化学习或需更细致调优。
  • 联系文本: 证实传统数学建模与现代机器学习方法的互补,增强模型鲁棒性。[page::10]



---

4. 估值分析



该报告属策略建模范畴,未直接涉及财务估值问题。其核心在市场订单的填充概率优化与库存风险平衡,无传统资产定价或估值模型应用。因此不涉及市场估值指标(P/E、DCF等)。

---

5. 风险因素评估



报告隐含风险包括:
  • 模型假设风险:

- 竞争对手报价线性依赖库存且动态规则简化可能忽视多种市场复杂微观机制。
- 噪声过程假定独立,现实中可能存在相关性和复杂依赖。
  • 市场模型限制:

- 假设订单到达率为常数,忽视市场波动时交易量的动态演变。
- 指数填充概率模型为简化,未完全模拟高频市场流动性细节。
  • 数值算法风险:

- 强化学习模型训练时间长,参数敏感,可能陷入局部最优。
- 近似闭式解基于不等式假设,极端情形下可能失效。

论文虽未专设风险章节,但以上均可视为模型适用性的潜在限制。[page::3,6,10]

---

6. 批判性视角与细微差别


  • 模型简化的权衡:

竞争对手合并为单一线性规则制定者简化了复杂多主体动态,但可能忽略策略多样性和动态博弈效应。
  • 填充概率设定合理但非唯一:

指数衰减假设虽然简洁,实际市场成交概率受更多复杂因素支配。
  • 近似求解依赖特定假设:

所得闭式解基于最大值不低于竞争报价的假设,与最优HJB完全解并不一致,毕竟提供的是近似解。
  • 强化学习表现不及理论值提示现实算法还需深入调优或更丰富状态信息。

-
文献交叉引用恰当,理论基础扎实但实证验证有限。
  • 语句清晰,数学推导严谨,方法创新和实用性强。


---

7. 结论性综合



本文建立了一个包含竞争做市商的高频交易持仓与报价优化模型,创新性考虑了市场订单未被“参考做市商”成交时,订单由竞争对手承接而反馈影响未来成交概率的机制。通过对竞争者报价策略的线性假设简化,作者成功导出一个近似可解的线性-二次反馈最优策略,避免了复杂的随机博弈分析。理论模型通过矩阵常微分方程得到近似闭式解,实现了从概念到实际可计算策略的转换。

数值实验显示:
  • 报价策略对自身及竞争者库存动态响应并合理调整报价深度,体现风险-收益均衡。

- 绝大多数模拟中参考做市商报价未超越竞争者,只有在库存较大时短暂提升报价,以加快风险回避。
  • 近似闭式解策略表现接近高精度Euler差分数值解,远优于简单强化学习算法,验证了解析解的实际应用价值。


论文为高频量化交易策略设计提供了新视角,即在多做市商环境下如何合理考虑竞争效应调整报价;同时,其方法兼顾理论及计算效率,具有较高推广价值。结合当代机器学习与传统控制理论提出了有效的强化学习与数学分析相结合的实践路径。未来工作可探索多资产、多策略更复杂设定及实时在线学习算法。

综上,该报告为做市策略领域贡献了一个理论创新与实证验证兼备的先进模型,其核心结论和图表展示了竞争对手库存与策略如何显著影响最优报价与库存管理,强调市场行为的交互效应与动态调整机制的重要性。[page::0–10]

---

参考文献溯源



主要论述与模型构建参考Avellaneda and Stoikov (2008)基础模型,[page::0–1];并基于Gueánt et al. (2013)的线性-二次近似法进行数学求解,[page::5–7];数值与强化学习对比借鉴了PPO算法及多篇近期工作成果,[page::9–10]。

---

总结



本报告深入揭示了在竞争激烈的做市环境中,参考做市商如何通过动态优化报价策略应对外部竞争压力及库存风险的复杂交互,建立数学严密与计算有效的解决方案,对高频交易领域的理论与实践均具有较强参考价值。

报告