`

Estimation of bid-ask spreads in the presence of serial dependence

创建于 更新于

摘要

本报告针对交易价格存在序列相关性的情况,提出四类基于价格增量方差的买卖价差估计器,涵盖标准无自相关模型、分数布朗运动价格增量自相关模型、均值回复的Ornstein-Uhlenbeck微观结构噪声模型及二者结合模型,深入分析各估计器的无偏性、一致性和渐近正态性等统计性质。通过模拟与真实法国CAC 40指数数据对多个估计器进行比较,验证了新估计器对不同序列相关结构下的估计准确性优于传统方法,尤其是在低流动性的中小市值股票上[page::0][page::1][page::2][page::3][page::4][page::5][page::7][page::8][page::9][page::11][page::12][page::13][page::16][page::18][page::21][page::22][page::23]

速读内容

  • 论文基于包含微观结构噪声的交易价格模型,分别考虑价格对数中位价的布朗运动与分数布朗运动(fBm)假设,并引入考虑交易符号的微观结构噪声序列相关性,通过分位点矩估计构建4类估计器:[page::0][page::1][page::2][page::3]

- 标准无自相关模型下,估计量利用不同时间间隔价格对数增量的方差差异估计买卖价差S²,并证明其无偏、强一致性及渐近正态性,有详细公式化方差和协方差表达式支持该估计器理论优越性 [page::3][page::4]

- 估计的标准差远小于真实S²值,单日一分钟采样数据即可得到较高精度估计
  • 在价格增量具有分数布朗运动序列相关(Hurst指数H)下,估计方法扩展为包含H参数的加权方差差异估计器,针对H未知则先估计H后带入估计器,详细推导估计的偏差和渐近分布,指出Roll估计器因序列相关会存在偏差[page::7][page::8][page::9][page::10]


- 估计误差对H估计偏差敏感,高H值估计H的不确定性会导致估计器偏离真实值
  • 针对微观结构噪声存在自相关且可模型化为二值化均值回复Ornstein-Uhlenbeck过程,设计了相关自相关度参数ρ的买卖价差估计器,并提出无参估计ρ的替代方法,保证估计器在自相关交易噪声下无偏性及渐近正态性[page::11][page::12][page::13]

- 综合考虑价格及交易符号都存在序列相关,建立多参数联合估计框架,通过最小化时尺度方差拟合估计买卖价差及相关参数,更为实际[page::13][page::14]
  • 与Roll、Corwin-Schultz(CS)、Abdi-Ranaldo(AR)、Ardia-Guidotti-Kroencke(AGK)等传统方法对比,在无依赖、价格自相关及交易自相关三种市场模型下通过10,000次模拟对比,发现提出方法针对对应模型显著降低估计偏差和均方差,并通过bootstrap检验确保估计可信度[page::16][page::17][page::18]

- 特别地,对于价格自相关且H<0.5,标准Roll与传统方法存在显著偏差;分数布朗运动估计器$\widehat{S}{2,1}$表现最佳。对交易自相关模型,$\widehat{S}{3,1}$估计偏差最小且通过统计测试[page::16][page::18]
  • 模拟分析表明,基于高、低价的估计器如CS对交易稀疏度敏感,表现较差;而基于收盘价的Roll和$\widehat{S}{1,1}$抗稀疏能力强[page::20]

  • 实证法国CAC40成分股日频数据,利用实际五分钟买卖价差作对比,计算RMSE和MAPE指标,发现$\widehat{S}{1,1}$整体表现最佳,$\widehat{S}{2,1}$其次,且$\widehat{S}{2,1}$与$\widehat{S}{3,1}$在中小市值股票上表现优于其他估计器,适用性更广[page::21][page::22]

- 不同估计器性能与股票市值排名Spearman相关分析显示,AGK$^1$与$\widehat{S}
{1,1}$对大中小市值均适用,$\widehat{S}{2,1}$与$\widehat{S}{3,1}$对中小市值表现更优,Roll、AR、CS则对大市值更有利[page::22]
  • 时间序列结果及图示显示,中小市值股票买卖价差估计的估计器差异大,经典Roll与AR估计偏低,提示序列相关模型更符合真实交易情况[page::23]

  • 论文理论部分严格证明了估计器的无偏、一致和渐近分布性质,依赖对相关结构的精妙处理,包含相关拉德马赫分布变量分解及矩方法[page::27][page::28][page::29][page::30][page::31][page::32][page::33][page::34][page::35][page::36][page::37][page::38][page::39]

深度阅读

金融研究报告详尽分析报告


报告标题:Estimation of bid-ask spreads in the presence of serial dependence
作者:Xavier Brouty, Matthieu Garcin, Hugo Roccaro
发布日期:2025年1月7日
主题:基于价格时间序列,研究具有序列相关性的市场中竞买竞卖价差估计方法

---

1. 元数据与报告概览



《Estimation of bid-ask spreads in the presence of serial dependence》旨在解决传统竞买竞卖价差(bid-ask spread)估计方法在存在价格或交易序列相关性时所出现的偏误和不足。作者从经典的微观结构模型出发,先构建无序列相关性的基本模型,进而考虑两种序列相关情形:(1)价格遵循分数布朗运动(fractional Brownian motion, fBm);(2)微观结构噪声(microstructure noise)服从Ornstein-Uhlenbeck过程。这些序列相关使得传统Roll等估计量产生偏差,作者提出基于价格涨跌幅的矩估计器,系统推导其统计性质,且在模拟和真实数据中,与经典方法(Roll估计器、Corwin-Schultz、Abdi-Ranaldo、Ardia-Guidotti-Kroencke)比较,显示其更强的鲁棒性和准确性。
核心贡献包括:
  • 对无序列相关和两类序列相关模型提出了一套统一的矩估计器,带有渐近正态性质。

- 提出在微观结构噪声中带有序列相关时,如何通过估计Hurst指数和噪声相关衰减参数来有效校正竞买竞卖价差估计。
  • 引入对Correlated Rademacher(二点)变量的分解理论,支持估计量方差分析。

- 模拟和实证验证提出估计器的性能。

---

2. 逐节深度解读



2.1 摘要与引言


  • 引言强调流动性风险对资产定价和风险管理的重要性,并指出竞买竞卖价差作为流动性指标的关键作用。虽大市证券市场的盘口价差可直接观测,但其他资产(如场外债券、暗池等)价差为隐含变量,需通过价格时间序列推断。现有估计方法多忽略序列相关性,导致偏差,本文解决此难题。

- 论文定位为以统计矩方法估计价差,重点在于捕捉和修正序列相关影响,同时简化为仅利用收盘价的涨跌幅数据,便于实际应用。[page::0,1]

2.2 市场模型与基本问题陈述(第2节)


  • 建模基础等式(2)中观察价$Pt$由中间价$Pt^$偏移半个价差$S$的微观噪声$S(Xt - 0.5)$扰动组成,$Xt$为买卖方向变量。

- 核心假设:价差$S$在估计周期内常数,买卖可能性均等且中间价与微观噪声独立(Assumption 1)。
  • 论文目标:基于离散采样的对数价格$pt$,设计估计$S^2$(价差平方,便于数学处理)的矩估计器,考虑不同序列相关结构的四类模型。

- 统计估计中可采用变换确保估计价差为正,并利用连续映射和delta方法保证一致性和渐近正态性。
  • 细化估计基于不同时间尺度$L$的对数差分方差$V(L\tau)$,其中包含波动率和价差项,估计利用方差在不同尺度的组合消去波动率参数,单独估计价差。[page::2]


2.3 无序列相关模型估计(2.2.1节)


  • 假定中间价为标准布朗运动,且微观噪声序列独立(Assumption 2)。

- 理论上,价格增量方差$V(L\tau) = L\tau \sigma^2 + \frac{S^2}{2}$,需双尺度结合$\widehat V(L)$和$\widehat V(L')$消除$\sigma^2$项,得到估计量公式(6)。
  • 对三类样本方差估计器$\widehat V1, \widehat V2, \widehat V3$分别给出期望和方差表达式,考虑时间序列成分相关性(交叉项因子,方差表达式中$\sigma$和$S$混合)。

- 采用delta方法推导估计价差$\widehat{S^2}$的无偏性、一致性及渐近正态性(Theorem 1)。
  • 展示图1(见下节详解)标准差远低于真实价差平方,验证了估计的准确性和效率。

- 讨论参数$L,L'$选取对估计性质的影响,提议使用多估计值的中位数减少方差和负值问题。[page::3,4,5,6]

2.4 带价格增量序列相关的估计(fBm模型,2.2.2节)


  • 价格中间价被拟合为分数布朗运动$pt^ = \sigma Bt^H$,Hurst指数$H$度量自相关强度(Assumption 3)。

- 对价差方差的表达式改进为$V(L\tau) = (L\tau)^{2H} \sigma^2 + \frac{S^2}{2}$,引入了Hurst项,使得以往估计量产生偏差,且偏差依赖于$H$的大小,例如当$H<>1/2$时常见的过估计或低估问题。
  • 新估计器$\widehat S{2,v}^2$(公式9)依赖于$H$,实际中$H$需先估计,估计器形式包含三尺度方差差分比率估计$H$(公式10)。

- 给出$fBm$自协方差结构和估计方差(Propositions 3,4),证明估计量一致性和渐近正态性(Theorem 2),结论只对$H\leq3/4$有效。
  • 探讨$H$估计误差对价差估计的冲击(图2显示低$H$时已知$H$估计更稳健,高$H$下估计$H$引入的误差放大)[page::7,8,9,10]


2.5 带相关交易方向的估计(Ornstein-Uhlenbeck微观噪声模型,2.2.3节)


  • 微观噪声噪声为离散信号化的隐藏连续Ornstein-Uhlenbeck过程,产生以指数衰减形式的自相关(Assumption 4)。

- 导出微观噪声二值过程自相关的精准表达式(Proposition 5)。
  • 价差方差公式扩展为$V(L\tau) = L \tau \sigma^2 + \frac{S^2}{2} (1 - e^{-L\tau/\lambda})$ ,销量噪声相关长度由$\lambda$控制。

- 新估计器$\widehat{S}
{3,v}^2$(公式15)含参数相关衰减$\rho = e^{-\tau/\lambda}$,需估计此参数以免偏。
  • 给出估计$\rho$方法(公式16),进而构建无参数估计器。

- 推导方差估计表达式(Propositions 6,7),证明估计量性质(Theorem 3)。
  • 理论和模拟均表明该方法相比传统Roll等估计减少了自相关引发的偏误。[page::11,12,13]


2.6 完全集成序列相关模型(2.2.4节)


  • 融合分数布朗运动和Ornstein-Uhlenbeck相关交易的双重相关模型(Assumption 5)。

- 系统参数众多,采用最小二乘拟合多尺度方差实现多参数联合估计(公式19),规避多步估计误差累积。
  • 该方法为理论框架提供最完整的建模和估计方法。[page::13,14]


2.7 其他竞买竞卖价差估计法(第3章)


  • 经典Roll估计器基于连续价格差分协方差,假设无序列相关,估计简单但对序列相关极其敏感。

- Corwin-Schultz利用高低价范围构造估计器,融合波动区间信息;同类还有Abdi-Ranaldo考虑闭盘价中间价混合的协方差型估计。
  • Ardia-Guidotti-Kroencke (AGK)估计方法,设计上针对稀疏交易时问题进行调整。

- 多种传统方法,均在依赖高频序列和假设不同。论文提出的新估计器实现更广泛的序列相关适应性。[page::14,15]

2.8 模拟测试(第3.2节)


  • 使用10000条日内1秒采样的模拟轨迹,基于三类模型1、2、3 ——无序列相关、带fBm价格相关和带Ornstein-Uhlenbeck交易相关。采样后转为1分钟级数据。

- 对比四个新估计器($\widehat{S}{1,1}$,$\widehat{S}{2,1}$,$\widehat{S}{3,1}$,$\widehat{S}{4,1}$)与六个经典估计方式。
  • 性能指标包括偏差、标准差、均方误差和基于Bootstrap的假设检验(是否能合理接受真价差)。

- 结果显示:
- 无序列相关时$\widehat{S}{1,1}$最佳,AGK$^2$方差最小,但存在偏差过信风险;
- fBm相关时,$H=0.3$时$\widehat{S}
{2,1}$表现最佳,其他估计器多有偏差且被拒绝,$H=0.7$时表现相对差;
- 交易相关时,只有$\widehat{S}{3,1}$表现出正偏且最优,其他估计器普遍负偏;
  • 结果进一步通过绘图表现估计偏差和随真实价差波动的敏感度(图3、4)。[page::16-19]


2.9 稀缺交易模拟(3.3节)


  • 通过模拟连续、间断(概率$\pi^{\mathrm{liqu}}$)交易情形,检验估计器鲁棒性。

- 发现依赖高低价的CS对稀缺交易极其敏感,AR较好,AGK系列包含校正表现良好。
  • Roll和基于收盘价的$\widehat{S}{1,1}$相对稳健,尤其后者无视高低价波动,适合稀缺交易环境。

- 图5详细展示估计随交易频率降低的性能变化趋势。[page::20]

2.10 实证应用(3.4节)


  • 选用法国CAC 40指数中40只股票的数据(2022-09-19至2023-03-31),分1分钟及5分钟级别价格与成交价差数据。

- 使用对数RMSE与MAPE评价估计性能,结果聚合示于表5。
  • $\widehat{S}{1,1}$最优,$\widehat{S}{2,1}$和Roll次之,特别$\widehat{S}{2,1}$在部分小市值股票上表现优异,表6表明其在小市值股票中相对准确度更高。

- 实际价差时间序列(图6)显示不同估计器在高低市值股票上表现差异显著,经典Roll估计器在小盘股显著偏低,表明新估计器实际意义明显。
  • 结论推荐在非高度流动环境优先考虑序列相关校正估计器。[page::21-23]


---

3. 图表深度解读



图1(page::6)


描述:估计器$\widehat{S
{1,3}^2}(n,1,3)$标准差随真实价差$S$变化。
解读:
  • 黑色虚线为$S^2$,多条曲线对应不同样本量$n$。样本量越大,标准差越小。

- 标准差均远低于真实值,说明估计稳定且有效,即使1小时内仅有60个样本,也表现出相对较小的估计不确定性。
  • 不同$n$值展示了样本规模对估计效率正面影响。

支持文本:验证了Theorem 1中渐近正态性质及低方差表征。[page::6]

图2(page::10)


描述:理论上一个单样本扰动对估计Hurst $H$和价差$\widehat{S}$的冲击响应。四图分别展示估计的Hurst指数和价差分别在$H$已知和被估计情况下的稳定性。
解读:
  • Hurst估计(左上)在$H$附近有尖峰,估计误差放大显著,特别低$H$更显著。

- 已知$H$估计价差(右上)对干扰较稳健;估计$H$后估计价差(左下、右下)对扰动更为敏感,尤其在高$H$(0.7)时,估计失稳风险大。
  • 说明序列相关估计复杂性明显,误差传播风险需慎重处理。

支持文本:揭示估计器重要局限和实用注意事项。[page::10]

图3、4(page::19)


描述:各估计器估计值对真实价差偏差与标准差比较。
解读:
  • 模型1(无序列相关)中$\widehat{S}{1,1}$偏差极小,其他如CS、AGK$^2$有系统偏差。

- 模型2中,$H=0.3$时$\widehat{S}
{2,1}$表现最佳,$H=0.7$时$\widehat{S}{2,1}$误差变大,提示$H$效应显著。
  • 模型3中,只有$\widehat{S}{3,1}$估计偏差较小,其他均负偏差,提示交易相关必须适当考虑。

- 明显提示序列结构识别对估计效用至关重要。
支持文本:模拟实证展示估计器针对不同市场结构的适用性与局限。[page::19]

图5(page::20)


描述:高低价基估计器与基于收盘价估计器在不同交易活跃度($\pi^{\mathrm{liqu}}$)下的表现。
解读:
  • CS表现最差,估计价差明显偏小,尚需高交易流动性支持。

- AR估计对流动性敏感度较低,$\pi^{\mathrm{liqu}}>0.4$时达到较理想状态。
  • 基于收盘价的Roll和$\widehat{S}{1,1}$对流动性有较强鲁棒性,适合稀缺行情。

- 反映实务中流动性与估计方法选择的现实平衡。
支持文本:验证了基于涨跌幅的估计方法的适用场景优势。[page::20]

图6(page::23)


描述:两支股票RMS(HERMES,蓝筹)与EN(Bouygues,小盘)6个月估计价差时间序列对比多估计器。
解读:
  • RMS估计总体接近真实价差,Roll等经典估计偏低不明显。

- EN股估计价差差异更大,Roll及AR明显偏低,$\widehat{S}
{1,1}$、$\widehat{S}_{2,1}$较接近真实价差。
  • 显示小盘、流动性不足股票更需序列相关修正估计方法支持。

支持文本:揭示估计器在不同流动性条件下表现差异及应用建议。[page::23]

---

4. 估值分析



本报告核心估值内容为参数估计中的价差估计,与传统资产估值不同。估计方法围绕几种计量模型构建,基于方差矩的组合消除波动率干扰,估计价差平方$S^2$。
利用不同模型引入序列依赖性(fBm动态、Ornstein-Uhlenbeck交易噪声)和相应的矩构造,利用极限定理和delta方法保证估计器统计性质。
这种基于矩法的参数估计,实现了结构模型统计有效估计,未涉及传统估值指标的定价计算。

---

5. 风险因素评估


  • 样本频率与时间尺度选择影响估计方差,低样本导致估计不稳定;过小$L,L'$参数虽降低方差但易使估计负值。

- $H$和$\lambda$参数估计误差对最终价差估计带来非对称影响,尤其在$H$估计当中,误差扩散显著。
  • 交易活动稀疏时,基于高低价的估计器存在显著偏差风险。

- 多数传统估计在存在序列相关情况下表现差,风险是估计偏误导致的流动性判断错误。
  • 模型假设如微观噪声独立与中间价独立在现实中可能失效,本文模型虽简单但需谨慎验证。


---

6. 批判性视角与细微差别


  • 本文框架承载的主要假设是中间价和微观噪声独立、价差恒定、买卖方向均等,以及选定序列相关结构(fBm、OU)。实际市场中,这些条件可能偏离,导致估计误差。

- 序列相关引入的模型仅考虑了两种类型,未覆盖非线性、多因子相关及交易价与价格增量相互影响的复杂情形。
  • $H$和$\lambda$估计器的敏感性提示实际使用中对参数估计器的稳健性需加强,并可能需要更多辅助信息或更复杂模型。

- 尽管拟合目标多样,估计仍基于价差平方,基于平方反推价差存在非平滑变换,可能带来极端值处理困难。
  • 模拟均基于特定参数设定,对不同市场条件如极端波动、极低流动性等情形的泛化能力未知。


---

7. 结论性综合



整体而言,本文系统地构建了一整套针对竞买竞卖价差估计的矩估计方法,适应无序列相关及两类显著序列相关场景(价格增量相关和微观噪声相关)。数学严谨,理论证明估计器的无偏性、一致性和渐近正态性质,特别是对带有序列依赖这类更为复杂的市场微观结构,提供了新的估计工具。

模拟结果表明,所提估计器在对应及复杂市场结构下优于传统Roll、Corwin-Schultz、Abdi-Ranaldo、AGK等估计器,尤其在处理因序列相关造成的估计偏误方面效果显著。稀缺交易条件下,基于收盘价的估计器表现出优越的稳健性。

实证检验以法国CAC 40数据为例,进一步验证了新估计器在真实市场中具备较好性能,且在较小市值、更低流动性股票上优势更加明显。不同估计器针对不同市场活跃度适用性差异明显,提示实际应用中需结合市场特征和数据结构,灵活选择估计策略。

最后,作者指出未来研究方向:高频下价差估计结合价格与交易依赖,基于高低价格区间的序列相关估计器开发,及扩展适用更复杂市场结构和非线性相关的模型。

整体报告提供了理论与实证并重的、系统完整的竞买竞卖价差估计框架,对于量化交易、市场流动性分析及风险管理都有重要的参考价值。[page::0-23]

---

重要表格与图示Markdown展示

  • 图1:估计器标准差随真实价差的变化


  • 图2:扰动对估计Hurst指数与价差的冲击响应


  • 图3和图4:各估计器偏差与标准差



  • 图5:不同交易频率下估计器表现


  • 图6:两个股票6个月内价差估计序列对比



---

总结


本报告梳理了竞买竞卖价差估计理论,从基础模型到序列相关性的考量,提出了多种矩估计器。数学详实,涵盖渐近性质证明,模拟验证创新迭代效果优于经典。在实际案例中也展现了较为优越的估计性能。对进一步提升流动性风险测度精准度与相关金融模型定价能力具有重要意义。

报告