`

买卖报单流动性因子构建:——因子深度研究系列

创建于 更新于

摘要

本报告基于高频盘口数据挖掘构建了买单和卖单两种流动性因子(MCI_B和MCI_A),通过将高频因子降频为月频低频选股因子,实证回测显示MCI_B因子IC均值6.89%,年化多空收益26.58%,夏普比率2.71,表现优异。该因子及MCI_A均显著提升了原指数增强模型的表现,且因子在高频(分钟)和低频(月频)表现方向不同,体现了流动性风险溢价的存在 [page::0][page::2][page::10][page::13][page::16]

速读内容

  • 因子定义及计算逻辑 [page::2][page::3]

- 流动性本质为市价交易成本与限价交易成本的差距,以买单和卖单五档加权平均价格与买一、卖一报单价格均值的差值占比构建买单流动性因子MCIB和卖单流动性因子MCIA,进一步通过资金量加权归一化获得bps/万元单位常用因子。
  • 高频转低频构造方法 [page::7][page::8]

- 对分钟级因子做横截面标准化后加权求日频因子,再利用指数衰减加权法转换为月频因子,增加信息时效性的表达。
  • 高频与低频因子表现对比及相关性分析 [page::8][page::9]

| 因子 | MCIA | MCIB | MCIIMB |
|--------|--------|--------|----------|
| 分钟IC均值 | -2.80% | 9.44% | -10.69% |
| 月频IC均值 | 6.56% | 6.89% | -0.91% |
- 高频MCI
B与短期收益正相关,MCIA负相关;低频上两者均呈现显著正相关,反映长期流动性风险溢价。
- MCI
B和MCIA与自由流通市值、换手率呈显著负相关,需市值和行业中性化处理,且与传统流动性因子相关性较弱,体现因子新颖性和独立性。
  • 单因子选股效果显著 [page::10][page::11][page::12]

- MCI
B表现最佳,IC均值6.89%,年化收益26.58%,夏普比率2.71,胜率81.30%。



| 分位 | 总收益(%) | 年化收益(%) | 夏普比率 | 最大回撤(%) | 胜率(%) |
|-------|-----------|-------------|-----------|-------------|---------|
| Q1 | 393.52 | 16.85 | 1.18 | 23.07 | 66.67 |
| ... | ... | ... | ... | ... | ... |
| Q10 | -57.9 | -8.09 | -0.63 | 60.09 | 39.84 |
  • 指数增强应用效果突出 [page::13][page::14][page::15]

- 在沪深300及中证500样本池内,加入MCIA或MCIB的3因子组合提升显著,年化超额收益提升2%以上,夏普比率提升明显。

| 组合 | IC均值(%) | 年化超额收益(%) | 夏普比率 | 最大回撤(%) |
|------------------|-----------|-----------------|----------|-------------|
| 3因子等权 | 6.08 | 7.16 | 0.96 | 7.60 |
| 3因子+MCIA等权 | 6.00 | 9.17 | 1.31 | 7.13 |
| 3因子+MCI
B等权 | 6.35 | 9.32 | 1.43 | 4.47 |

  • 研究总结与贡献 [page::15][page::16]

- 本文创新区分买单和卖单流动性,构造两个高频流动性因子,调整资金量归一化处理,挖掘买卖报单量不平衡的市场微结构信息。
- 实证显示因子具有显著的风险溢价特征和优秀选股能力,且对原有指数增强模型有明确提升,具备较强的投资指导意义。

深度阅读

买卖报单流动性因子构建——因子深度研究系列报告详细分析



---

一、元数据与概览



报告信息

  • 标题:《买卖报单流动性因子构建:——因子深度研究系列》

- 作者:丁鲁明(中信建投首席分析师)、陈升锐(金融工程研究员)
  • 发布机构:中信建投证券股份有限公司

- 发布日期:2020年10月23日
  • 主题:基于高频盘口数据构建买单和卖单流动性因子($MCIB$、$MCIA$),应用于A股市场的选股策略与指数增强模型


报告核心论点与目标


报告通过深度挖掘股票盘口高频数据,创新地构造了两个高频流动性因子:买单流动性因子$MCIB$和卖单流动性因子$MCIA$,并将其向月频转化形成低频选股因子。单因子回测结果显示,这两个因子均表现优异,特别是$MCIB$因子,在信息系数、收益率和夏普比率方面领先其他传统因子。同时,它们对于已有指数增强模型的表现提升明显,有望成为流动性量价因子的新突破。报告意图传达买卖双方流动性非对称的重要性以及基于边际交易成本构建因子在量化投资中的实际价值。

---

二、逐节深度解读



1. 买卖报单流动性因子定义和投资逻辑



1.1 买卖报单流动性因子简介

  • 报告指出,传统流动性指标多采用对称指标(如价差QuoteSpread),忽视买卖双方流动性的不对称性,且未区分买方卖方的不同交易成本表现。

- 作者将流动性定义为“立即交易(市价交易)和延时交易(限价交易)之间交易成本的差距”,利用市价交易成本与限价交易成本的相对差异百分比来衡量。
  • 限价交易成本假设为买一与卖一价的均值$M$,市价交易成本用买卖五档报单的量价加权平均价(VWAP)表示。

- 分别针对卖方和买方计算两种流动性因子:
- 买单流动性因子$MCIB = \frac{-VWAPMB}{DolVolB}$,其中$VWAPMB = -\frac{VWAPB - M}{M}$,强制将交易成本转为非负。
- 卖单流动性因子$MCI
A = \frac{VWAPMA}{DolVolA}$,$VWAPMA = \frac{VWAPA - M}{M}$。
  • 最终单位为“bps/万元”,即当流动性需求者用1万元资金立即买入或卖出时所付出的平均交易费用。


1.2 投资逻辑

  • 短期视角:

- $MCIB$较大→市价卖方支付更多交易费用→买方强势→股票难跌→未来短期收益正相关。
- $MCI
A$较大→市价买方支付更多交易费用→卖方强势→股票难涨→未来短期收益负相关。
  • 长期视角:

- $MCIB$和$MCIA$均代表流动性风险溢价,流动性越差,风险越高,因而长期收益与这两个因子均为正相关。
  • 买卖报单流动性不平衡因子$MCI{IMB} = \frac{MCIA - MCIB}{MCIA + MCIB}$,衡量买卖双方交易费用差值。该因子在短期与收益负相关。


1.3 买卖报单流动性因子计算实例

  • 以贵州茅台、中国银行、金洲慈航三只股票盘口数据为例,算出对应因子值。

- 结果显示:
- 贵州茅台和中国银行流动性成本极低,体现其市场高流动性。
- 金洲慈航的流动性成本是前两者的约1000倍,流动性极差。
  • 说明不归一化资金量直接计算的交易成本会失真,资金量归一化处理使得流动性因子更合理地反映市场真实流动性差异。


2. 高频转低频的方法和逻辑


  • 高频因子分分钟计算,但选股实务一般为月频或日频。

- 采用步骤:
- 横截面标准化,剔除市场整体走势对个股因子的影响。
- 以等权法计算日因子(分钟数据均值)。
- 利用指数加权衰减法将月内日因子加权成月频因子,越接近调仓日加权越重。
  • 高频分钟IC与低频月频IC对比显示:

- $MCI
B$分钟IC均值$9.44\%$,月频IC$6.89\%$,二者方向一致且显著为正。
- $MCIA$分钟IC$-2.8\%$(负相关),月频IC$6.56\%$(正相关),反映高频短期信号与低频长期风险溢价的不同。
- 不平衡因子$MCI
{IMB}$高频负向明显,低频弱负相关。

3. 买卖报单流动性因子与常用因子相关性


  • $MCIB$和$MCIA$与自由流通市值和1个月换手率相关性较高(均为负相关,约-0.5~ -0.7),因此后续分析需市值及换手率中性化处理。

- 与传统流动性因子ILLQ和价差因子QuoteSpread相关性低,表明本因子捕捉流动性的不同维度。
  • 但$MCIB$和$MCIA$二者之间高度相关(0.9),显示两因子内部存在较强关联性。


4. 买卖报单流动性因子测试结果



4.1 MCIB因子选股效果

  • 因子IC均值$6.89\%$,年化信息比率(IR)2.76,年化多空收益率26.58%,夏普比率2.71。

- 胜率超过80%,最大回撤仅6.84%,表现非常稳健。
  • 超额收益按因子值十分位排序,前1分位年化超额收益近17%,后10分位为负约-8%,显示良好区分能力。

- 多空组合净值稳步向上,凸显风险调整后收益优势。

4.2 MCIA因子选股效果

  • 因子IC均值6.56%,年化IR2.64,年化收益24.32%,夏普比率2.44。

- 与MCI
B表现相当,同样展现出显著的因子有效性。
  • 年化超额收益分位表现与MCIB类似,前区间表现优良,后区间收益为负。


5. 买卖报单流动性因子在指数增强中的运用


  • 设计了3个增强组合:

1. 基础3因子组合(EP
TTM、Momentum1m、TurnoverAvg1M)
2. 3因子+MCI
A
3. 3因子+MCIB
  • 沪深300样本池

- 3因子组合IC均值6.08%,年化超额收益7.16%,夏普比率0.96。
- 加入MCI
A后IC均值6.00%,年收益增至9.17%,夏普比率1.31。
- 加入MCIB后IC 6.35%,年收益9.32%,夏普1.43。
  • 中证500样本池

- 基础组合IC均值7.46%,年化超额收益8.81%,夏普1.42。
- 加入MCI
A IC7.63%,收益9.88%,夏普1.66。
- 加入MCIB IC7.97%,收益9.58%,夏普1.67。
  • 组合同频段走势图显示,加入买卖报单流动性因子后组合超额收益稳定提升。

- 报告指出近期主流因子失效明显,而加入$MCI
A$和$MCIB$后模型依然持续贡献超额收益。

6. 总结与思考


  • 流动性作为影响报价效率和股票价格的重要市场微观结构变量,长期以来研究较少分买卖双方考虑。

- 本文创新基于资金加权的交易边际成本的理论构造买卖报单流动性因子,区分买卖双方不同流动性成本及其信息含量。
  • 买单和卖单流动性因子在高频和低频层面均体现出显著的选股能力和风险溢价特征,单因子表现优于多数传统因子。

- 两个因子均能有效提升指数增强模型的稳定超额收益。
  • 因子与市值和换手率存在相关性,做了严格的中性化处理,避免因规模效应的干扰。

- 该研究为后续深化微观结构理论视角下的流动性量价因子构建与资产定价提供了重要方法论和实证支持。

---

三、图表深度解读



图1-3: 买卖报单流动性因子计算实例(贵州茅台、中国银行、金洲慈航盘口数据)

  • 展示三只价格、卖买五档报单价格及数量,计算得到$M$、$VWAP$及因子具体数值。

- 贵州茅台流动性因子值在$10^{-3}bps/万元$量级,显示其极高流动性。
  • 中国银行数据相似,验证大市值股票市场流动性特征。

- 金洲慈航因子显著增大,流动性成本远高于两大蓝筹,表明小市值股票流动性差。
  • 说明因子通过资金量标准化消除了价格和市值的交叉影响,得到容量无关、更客观的流动性衡量指标。

- 数据兼具微观细节和宏观比较意义。

表1:分钟和月频IC对照表

  • 真正展示了高频与低频因子IC的定量对比。

- $MCI
B$分钟IC方向强正(9.44%),$MCIA$负向(-2.8%),$MCI{IMB}$负相关明显。
  • 月频IC均值全都正,解读为流动性风险溢价。

- 这一对比揭示了因子短期信号与长期风险定价双重内涵。

表2:买卖报单流动性因子与常用因子的相关性

  • 显示$MCIB$、$MCIA$与主流因子如换手率、规模、市盈率等的相关系数,及低相关的传统流动性因子ILLQ和报价差价。

- 强调了因子的独特信息含量及需中性化调整的必要性。

图4-9:因子各十分位收益表现及净值曲线

  • 对$MCIB$和$MCIA$因子表现的直观展示。

- 前分位组表现显著优于后分位,收益区分明显。
  • 净值曲线显示因子组合多年稳健增长,最大回撤可控,夏普比率高达2.4以上。

- 因子选股的稳定性极佳,风险调整后的收益显著。

表3-4及图10-11:指数增强组合对比

  • 3因子基础组合与加入$MCIA$、$MCIB$的强化组合对比。

- IC均值和年化超额收益提升明显。
  • 夏普比率提高50%左右,最大回撤降低,收益风险比显著改善。

- 不仅统计意义显著,图示也显示增强组合净值稳步跑赢基准。

---

四、估值分析



本报告核心处不涉及具体的公司或资产的估值,但其因子研究对量化选股和组合构建至关重要。报告通过信息系数(IC)、IR、夏普比率、收益回撤比等指标对因子效果进行了全面的统计评估,而不是传统的DCF等方法。因此“估值分析”部分体现为因子表现的统计度量,这些指标的定义为:
  • IC(信息系数):因子值与未来收益之间的相关系数,衡量因子预测能力。

- IR(信息比率):IC均值与标准差的比值,衡量因子稳定性。
  • 夏普比率:风险调整后的收益率,越高表示收益越优异且波动较小。

- 最大回撤/收益回撤比:风控指标,反映风险损失大小及收益相对大小。

报告清晰说明市值和行业中性化处理通过降低无关干扰使因子表现更为纯净和稳健。

---

五、风险因素评估



报告本身未明确列出专项风险提示条目,但结合报告内容与量化模型实务可归纳风险点如下:
  • 数据质量风险:盘口高频数据的完整性和同步性存在风险,如异常跳变可能影响因子准确性。

- 模型假设局限
- 假设买卖五档报单代表市场最佳流动性,但实际可能存在隐含订单或算法交易。
- 资金量归一化假设可能不足以完全消除大宗订单对价格冲击的非线性影响。
  • 市场环境变化风险:流动性特征及风险溢价随市场波动、结构变化而变化,因子在不同市场周期的表现可能不同。

- 因子失效风险:如报告所述传统因子出现失效现象,流动性因子未来亦面临潜在失效风险。
  • 中性化处理误差:行业与市值中性处理如果不充分,可能导致因子捕捉的非流动性信息。

- 场外事件影响:政策、流动性紧缩、突发事件均可能打破假设前提。

报告虽未详述缓释措施,但通过净值回撤、胜率分析体现了风险可控性。

---

六、批判性视角与细微差别


  • 报告强调买卖双方流动性不对称性,但$MCIB$和$MCIA$因子高度相关(0.9),这个高度相关说明两者在一定程度上反映同一流动性特征,独立性有待进一步挖掘。

- 月频IC由原先分钟级别不同方向($MCIA$负,$MCIB$正)变为均正,这与风险溢价解释一致,但若仅用月频数据作分析,短期买单流动性负向信号可能被掩盖,需要灵活应用。
  • 资金量归一化设计合理,但其处理资金规模不同股票流动性的方式可能高估小市值非流动股的风险溢价,需注意因子规模适用性。

- 选取的三个股票计算示例较典型,未覆盖极端流动性股票,少量示例限制了更广泛适用性解释。
  • 报告未提供详细交易成本或冲击成本的实证对比,理论假设与实际交易成本间的关系需要后续研究深化。

- 指标单位为“bps/万元”,虽规范,但该度量对大资金投资者的适用性需要进一步探讨。

---

七、结论性综合



该报告整体系统地构建了两个基于市价交易与限价交易边际成本差异的买卖报单流动性因子$MCIB$和$MCIA$,突破了传统流动性因子对买卖双方对称性的简化假设。此创新在高频层面揭示了买压和卖压对短期股票收益的预测能力,并在月频层面体现该因子作为流动性风险溢价因子的核心价值。

从实例数据计算可见,因子合理地归一化了资金规模,真实反映了不同类型股票的市场流动性水平。深入统计分析说明两个因子均具备稳定的预测能力,常年持有可获得年化多空收益率约25%以上,且夏普均超过2.4,风险调整表现优异。将该因子加入传统选股组合后,提升了基准指数增强组合的IC均值、超额收益及夏普比率,尤其在过去因子失效期表现同样稳健,具有真实可操作性。

图表中因子净值曲线平稳上升,且十分位收益差异明显充分支持其选股有效性。因子在风险收益权衡方面展现出非常优秀的表现,是具备实证基础的高频量价流动性信号。

报告结构严谨,理论与实证逻辑清晰,论据充分。因子计算方法及转频方法科学,展示了金融工程运用高频微观数据创新挖掘预期收益的典范。然而,因子高度相关性及数据样本限制提醒投资者应用时需注意合适的多因子组合搭配和不同市场环境下的适应性。

总体而言,报告呈现出的买卖报单流动性因子框架,具备显著的学术价值与投资指导意义,值得在资产管理及主动投资实践中进一步开发与应用。

---

参考文献

  • Brennan, Chordia, Subrahmanyam (2012). Sell-order liquidity and expected returns.

- Holden & Jacobsen (2014). Liquidity Measurement Problems in Fast, Competitive Markets.
  • Korajczyk & Sadka (2008). Pricing the commonality across alternative measures of liquidity.

- Pástor & Stambaugh (2003). Liquidity Risk and Expected Stock Returns.

---

结语



本报告以严谨的研究方法,基于深度的金融工程手段,创造性地将买卖双方盘口流动性差异量化为可持续选股因子。报告的详实数据、科学模型及宽广视角为A股市场乃至其他市场流动性风险定价提供了启发和坚实基础,既为量化选股提供强有力工具,也推动了微观结构领域的实证研究。

[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17]

报告