`

买卖报单流动性因子构建:因子深度研究系列

创建于 更新于

摘要

本报告基于高频盘口数据,提出买单流动性因子MCI_B和卖单流动性因子MCI_A,捕捉市价交易与限价交易间的边际成本差异,转化为月频低频选股因子。在最近10年(2010-2020)沪深300和中证500样本池中回测显示因子IC均值与年化多空收益均表现优异,且显著提升传统指数增强模型表现,验证了流动性因子的长期风险溢价特征及其在选股和资产配置中的有效性 [page::0][page::10][page::13][page::15][page::16]

速读内容

  • 流动性因子构建原理:基于市价交易成本与限价交易成本之间的差值百分比,计算买单流动性因子MCIB和卖单流动性因子MCIA,进一步归一化资金量后,量化每万元股票立即交易所付出的交易费用,体现流动性成本 [page::2][page::3]

- 样本数据与计算示例:选取贵州茅台、中国银行、金洲慈航的盘口数据进行示范,分别计算各自的VWAP、买卖单均值M及最终MCI因子,显示不同市值股票流动性成本差异显著,流动性好的如茅台和中行,流动性差的如金洲慈航 [page::4][page::5][page::6][page::7]
  • 高频转低频方法:采用分钟级因子经过截面标准化和等权日均值计算后,使用指数衰减加权法生成月频因子,保证信息时效性和稳定性 [page::7][page::8]

- 高频与低频IC对比:高频分钟IC显示MCIB与未来短期收益正相关,MCIA负相关;而月频低频IC中两因子均表现出显著正相关,体现长期风险溢价效应 [page::8]
  • 与常用因子相关性分析:MCI因子与流通市值和换手率相关性较高,需做市值和换手率中性化处理;与其他常用流动性指标如ILLIQUID和QuoteSpread相关性弱,具备独特选股信息 [page::9]

- 单因子回测结果:
- MCI
B因子表现最佳,IC均值6.89%,年化多空收益26.58%,夏普比率2.71。
- MCIA次之,IC均值6.56%,年化多空收益24.32%,夏普比率2.44。





[page::10][page::11][page::12]
  • 指数增强应用:将MCIA和MCIB加入传统3因子(EPTTM、动量、换手率)模型,显著提升沪深300、中证500样本池的IC值、年化超额收益和夏普比率,尤其在近年来常用因子失效情况下依然保持有效的超额收益能力。


| 组合 | IC均值(%) | 年化超额收益(%) | 夏普比率 |
|-------------|-----------|----------------|----------|
| 3因子等权 | 6.08 | 7.16 | 0.96 |
| 3因子+MCIA | 6.00 | 9.17 | 1.31 |
| 3因子+MCI
B | 6.35 | 9.32 | 1.43 |


[page::13][page::14][page::15]
  • 结论与意义:买卖报单流动性因子基于盘口微结构信息,兼顾买方与卖方流动性,揭示了流动性的非对称性和买卖双方流动性不平衡。因子在长期带有风险溢价,能够有效提升选股和指数增强模型表现,具有较强的实用价值和扩展潜力 [page::0][page::15][page::16]

深度阅读

因子深度研究系列——买卖报单流动性因子构建报告详尽分析



---

1. 元数据与报告概览


  • 报告标题: 买卖报单流动性因子构建:因子深度研究系列

- 作者及发布机构: 金融工程研究团队,中信建投证券
  • 发布日期: 2020年10月25日

- 报告主题: 本报告聚焦于股票盘口数据的高频交易信息挖掘,提出两种基于买卖报单流动性的高频因子——买单流动性因子(MCIB)与卖单流动性因子(MCIA),并将其转化为低频(主要为月频)选股因子,检验其选股有效性及指数增强模型中的应用表现。
  • 核心论点与目标:

- 通过高频盘口数据逻辑挖掘,构造刻画买卖双方市价交易与限价交易成本差异的流动性因子。
- MCIB和MCIA在单因子测试中显示了显著的预测能力,尤其是MCIB的IC均值高达6.89%,年化多空收益26.58%,夏普比率2.71。
- 这两个因子对传统指数增强模型产生显著提升,表现出优异的风险调整后收益。

报告主要想传达,基于盘口真实流动性状况构建的买卖报单流动性因子,是识别股票未来收益的重要有效因子,尤其是结合高频数据与资金量归一化处理后,具备强大的预测性能和风险溢价属性[page::0,1]。

---

2. 逐节深度解读



2.1 买卖报单流动性因子定义和投资逻辑



2.1.1 因子定义


  • 核心概念: 流动性本质是立即交易(市价单执行成本)与延时交易(限价单潜在成本)之间的交易成本差异。

- 限价交易成本定义: 用买一价与卖一价均值M作为交易成本基准。
  • 市价交易成本定义及计算:

- 将买单或卖单五档报单量加权平均价VWAP作为市价交易成本,其中权重为报单对应量。
- 资金量归一化:因不同股票五档委托量规模不同,使用五档报单金额(DolVol,即价格乘以数量之和)对交易成本进行归一化。
  • 流动性因子(MCI)计算公式:


$$
MCI
{A} = \frac{(VWAPA - M)/M}{DolVolA} \quad (卖单)
$$

$$
MCI{B} = -\frac{(VWAPB - M)/M}{DolVolB} \quad (买单)
$$

其中,负号是为了确保交易费用为正值;单位bps/万元。该指标衡量发起市价交易时,每万元交易的平均交易成本[page::0,2,3]。

2.1.2 因子投资逻辑


  • 买单流动性因子 \( MCIB \):

- 数值越大,说明发起市价卖单时成本越高,表示买方压力更大,股票短期下跌难度加大,因此短期收益预期正相关。
  • 卖单流动性因子 \( MCIA \):

- 数值越大,说明发起市价买单时成本越高,表示卖方压力更大,股票短期上涨难度增加,因此短期收益负相关。
  • 买卖流动性不平衡因子 \( MCI{IMB} = \frac{MCIB - MCIA}{MCIB + MCIA} \):

- 衡量买卖双方流动性成本差异,范围[-1,1]。
- 正值表示卖方交易成本更高,股票倾向上涨,负值则相反,短期收益负相关。
  • 长期角度: MCIB与MCIA高值均代表流动性较差,流动性风险带有风险溢价,长期收益与因子正相关,而流动性不平衡指标反映短期价格压力,不代表长期流动性风险[page::3]。


---

2.2 买卖报单流动性因子计算实例


  • 三证券盘口数据分析:贵州茅台、中国银行、金洲慈航

- 三者均计算了买卖报单均价M、五档报单资金量DolVol、VWAP计算、市价交易成本百分比差异VWAPM等。
  • 发现:

- 贵州茅台买卖双方流动性成本均很小($\sim10^{-3}$ bps/万元级别),流动性极佳。
- 中国银行虽股价远低于贵州茅台,但流动性成本数量级接近,说明单位资金交易成本更具参考价值。
- 金洲慈航市值小,流动性指标明显恶化,成本高出贵州茅台与中国银行约100倍,反映其流动性较差[page::4,5,6,7]。

---

2.3 高频转低频因子构造方法及逻辑


  • 因子标准化: 先进行分钟级横截面截面标准化,剔除市场走势影响。

- 因子聚合: 用等权方法将分钟因子聚合成日因子,再利用指数衰减权重加权每月交易日的日因子转为月度因子,处理信息时效性。
  • 因子频率对比测试: 高频(分钟)级别上,MCIB与未来短期收益正相关,MCIA负相关。低频(月度)频率上,二者均正相关,因长期风险溢价属性体现明显[page::7,8]。


---

2.4 因子与传统因子相关性分析


  • MCIB和MCIA与流通市值(InFlaap)和一个月换手率(AmountAvg1M)相关性较强,需进行市值和换手率中性化处理。

- 与市场流动性传统指标ILLIQUID和买卖价差Quote
Spread相关性有限,表明买卖报单流动性因子捕捉了独特信息,与传统因子互补[page::8,9]。

---

2.5 买卖报单流动性因子单因子测试结果


  • 回测周期:2010年1月至2020年4月,样本池为沪深全市场,月频调仓。

- 两因子均进行了极值处理、缺失值处理、市值及行业中性化。
  • MCIB:

- IC均值 6.89%
- 年化信息比率(IR) 2.76
- 年化多空收益 26.58%
- 夏普比率 2.71
- 胜率 约79%(即预测准确比例)
  • MCIA:

- IC均值 6.56%
- 年化IR 2.64
- 年化多空收益 24.32%
- 夏普比率 2.44
- 胜率 约78%
  • 因子多空收益分位数明显分层,前三分位收益显著高于后组,充分体现选股能力[page::10,11,12]。


---

2.6 买卖报单流动性因子在指数增强模型中的应用


  • 构建三个增强组合:

1. 传统3因子等权(市盈率EPTTM、1月动量Momentum1m、1月换手率TurnoverAvg1M)
2. 3因子+MCIA等权
3. 3因子+MCI
B等权
  • 样本池与回测条件: 沪深300和中证500股票,2010-2020年,月度调仓,行业及极值处理。
  • 沪深300增强组合表现:

- 3因子IC均值6.08%,年化超额收益7.16%,夏普0.96
- 加入MCIA后IC 6.00%,收益9.17%,夏普1.31
- 加入MCI
B后IC 6.35%,收益9.32%,夏普1.43
- MCI因子带来的超额收益提升约2%,特别在近年来显著提升夏普比率,反映因子稳定及有效。
  • 中证500增强组合表现:

- 3因子IC 7.46%,年化超额收益8.81%,夏普1.42
- 加入MCIA后IC 7.63%,收益9.88%,夏普1.66
- 加入MCI
B后IC 7.97%,收益9.58%,夏普1.67
  • 图表显示增强组合收益净值持续超越基准,且加入流动性因子后曲线更为陡峭,体现出提升的选股效果和风险调整收益[page::13,14,15]。


---

2.7 总结与思考


  • 流动性作为影响股票价格的核心微观结构要素,其不对称性(买单与卖单的流动性差异)在定价中尤为重要。

- 利用盘口高频报单数据精准捕获买卖双方流动性特征,克服传统对称性假设,构造MCIB与MCIA两个高频流动性因子。
  • 通过合理归一化资金量及高频转低频构造,确保因子稳定有效,显著提升选股效果及指数增强策略表现。

- 两因子在单因子和多因子情境均展示了持续且显著的正向期望收益,夏普率和年化超额收益均优于常用因子。
  • 实证结果支持流动性风险溢价和价格压力的理论逻辑,揭示流动性因子在量化投资中的应用潜力和实践价值。

- 未来研究可探索更细粒度资金量分层归一方法及扩展至其他资产品种的因子构建与验证[page::15,16]。

---

3. 图表深度解读



3.1 图1-3:贵州茅台、中国银行、金洲慈航盘口数据(页4-7)


  • 盘面价格层次及委托量详解,体现不同市值和流动性水平资产的报单分布。

- 贵州茅台和中国银行流动性成本指标明显低于金洲慈航,突出小市值股票流动性成本数倍于蓝筹股。
  • 资金归一化后因子在不同市值间更具可比性,反映更真实交易成本。

- 数据支持因子定义及归一化设计的合理性,消解表面波动而揭示资金量对交易成本的决定性影响。

3.2 图4-6:MCIB因子选股效果(页10-11)


  • IC均值6.89%,年化收益26.58%,对应图表收益曲线体现稳健上升趋势,胜率超79%。

- 按分位进行收益率排序,最高分位收益远超最低分位,印证因子显著的区分能力。

3.3 图7-9:MCIA因子选股效果(页11-12)


  • 类似指标与结构,IC均值6.56%,年收益24.32%,稳健选股表现。

- 十分位超额收益展示不同风险暴露层次收益差异。

3.4 图10-11:指数增强组合超额收益净值(页14-15)


  • 包含传统三因子组合及其加入MCI因子的绩效对比。

- 加入流动性因子后,超额收益净值曲线显著陡峭,显示明显的策略增强效果。
  • 数据量化强化流动性因子对于优化多因子模型的贡献度。


3.5 表1-4(页8、9、13、14)


  • 表1显示分钟IC与月度IC的有机转化关系。

- 表2揭示流动性因子与传统因子的相关性,提示需做市值中性。
  • 表3-4为沪深300和中证500的指数增强模型对比,定量呈现流动性因子的提升效果。


---

4. 估值分析



报告不涉及具体的公司估值,而是基于因子投资角度进行因子构建和回测,没有传统意义上的DCF或市盈率估值模型,而核心通过统计学指标(IC、IR、夏普比率、收益分位等)度量因子质量与策略表现。因子有效性主要通过信息系数(IC)和风险调整收益表现体现。

---

5. 风险因素评估



报告未专门列出因子风险,但可合理推断:
  • 高频因子面临的过拟合风险及数据质量问题(盘口数据异动、异常爆仓等)。

- 因子可能随市场结构变化失效,特别是流动性改善或交易机制变更。
  • 市值和行业因子未完全中性化可能带来的系统性风险暴露。

- 投资策略依赖高频数据处理和计算能力,实施复杂度和成本较高。

报告中通过市值与行业中性化处理及多样样本池、长时间回测期缓解部分风险。

---

6. 批判性视角与细微差别


  • 报告强调MCIB与MCIA均表现优异,但IC均值差异较小,未深入探讨二者共同建模的相对贡献及潜在重叠信息。

- 资金规模归一化公式设计合理,但对极端流动性稀缺股票的适用性及稳定性探讨不多。
  • 报告无详述流动性因子在不同市场环境(牛市/熊市)的稳健性,缺少情境分析。

- 高频转低频的加权参数选择(如指数衰减系数0.5)虽合理,但参数敏感性及优化未详述。
  • 因子对换手率和市值高度相关,尽管做了中性化,仍可能在因子暴露风险管理上有改善空间。


---

7. 结论性综合



本报告系统构建了基于盘口买卖报单的流动性因子MCIB和MCIA,采用精细的资金量归一处理与高频数据转低频的标准化流程,提炼出准确反映市价交易相对限价交易交易成本的两个高频流动性因子。单因子回测表明MCIB表现尤为突出,IC均值接近7%,夏普比率和年化多空收益均达到优秀水平。

两因子不仅在单因子框架中表现优异,还能有效提升传统指数增强模型的预测能力和超额收益,且在沪深300及中证500样本池均有验证。报告通过深入定量分析和多案例计算实例验证了因子构建逻辑的合理性与实用性,进一步凸显流动性风险溢价的投资价值。此外,因子与传统流动性指标关联性较低,具有独特的市场信息。图表直观呈现了因子选股能力和策略增强效果,尤其是资金归一化后的因子指标具备跨股票对比优势。

该研究为流动性因子的高频构造方法提供了创新路径,同时为量化投资者利用盘口高频数据实现更精细的风险因子挖掘和组合优化提供了实操参考,具备较强的理论和应用价值[page::0-16]。

---

报告所用所有引用数据及结论均详见对应页码,涉及图表均已详述,方便追溯与验证。

---

附:关键公式与定义简明


  • \( M = \frac{P{A,1} + P{B,1}}{2} \) —买卖一档价格均值,即限价交易成本基准。

- \( VWAP
A = \frac{\sumi P{A,i} Q{A,i}}{\sumi Q{A,i}} \),同理买单侧VWAPB。
  • \( VWAPMA = \frac{VWAPA - M}{M} \),市价交易成本相对限价交易成本差异(卖单)。

- \( VWAPMB = -\frac{VWAPB - M}{M} \),买单对应市价交易成本差异(负号保证正值)。
  • \( MCIA = \frac{VWAPMA}{DolVolA} \),MCIB同理,单位bps/万元。

- \( MCI{IMB} = \frac{MCIB - MCIA}{MCIB + MCI_A} \),买卖流动性不平衡因子。
  • 频率转换及标准化公式详见前文章节。


---

如需进一步详情和数据验证,报告全文及图表待查阅[page::0-17]。

报告