`

主动买卖单的批量成交划分法

创建于 更新于

摘要

本报告系统研究了主动买卖单方向划分方法,重点比较了逐笔算法与ELO(2012)提出的批量成交划分法(BVC)。结果显示,BVC算法在委托驱动市场中能更准确地反映净主买占比与股价涨跌的匹配,相关系数达73%,远超传统订单流算法的59%。基于BVC算法构建的净主买占比OI与净换手率NTO因子在不同股票池、小市值股票中均表现出显著的Alpha收益,尤其短周期(5-20日)因子效果最好,多空组合年化收益率最高达14%。此外,BVC算法对冲击成本Istar模型的拟合效果优于订单流算法,整体解释力显著提升,显示交易数据的高效率提取价值[page::0][page::7][page::14][page::36]。

速读内容


主动买卖单分类方法综述 [page::2][page::3]

  • 主动买卖单分为逐笔算法和批量成交划分法BVC两大类。

- 逐笔算法包括成交价比较法(Tick Rule)、报价比较法(Quote Rule)和Lee-Ready判别法。
  • BVC算法基于时间或成交量间隔,结合股价涨跌的t分布概率分布,划分成交量的主动买卖占比,更适用于高频噪音较多的委托驱动市场。


BVC算法与订单流算法性能对比 [page::7][page::8][page::9]


  • BVC算法的日度净主买占比与日内股票涨跌幅的相关系数达73%(订单流算法为59%)。

- BVC算法净主买方向错误概率低,且错误时给出的因子值绝对值比订单流算法小。
  • BVC算法在日内和月度均表现出更高的方向匹配度,并在股价上涨时表现更优。


Alpha因子构造与选股表现 [page::14][page::15][page::16]

  • 主要因子包括净主买占比(OI)、主动买卖差额占比(|OI|)、净换手率(NTO)、多空力量差异度(|NTO|)。

- BVC算法的OI和NTO因子表现在全市场及中证500等小市值股票池中更优,ICIR绝对值多超过1,且短周期因子(5-20日)效果最佳。
  • 订单流算法构建的因子在正交化后大多失效,表现不及BVC算法。

- 负向IC显示净主买占比较高时,下月收益可能出现反转,符合无做市商机制市场的行为特征。

因子分组超额收益及相关性分析 [page::16][page::26][page::27]


  • OI和NTO因子与传统因子如反转、特异度高度相关,BVC算法相关性更强。

- 多头和空头端因子贡献表现明显,BVC算法对反转因子影响较小。
  • |NTO|因子选股效果显著改善,表明买卖力量差异越大,股票未来收益越低。


因子衰减特征及高频表现 [page::31][page::33][page::34]


  • BVC算法OI20与NTO20因子IC衰减速度适中,半衰期优于技术因子但快于基本面因子。

- 高频因子持有期越短,表现越好,OI5和NTO5因子ICIR最高,短期收益显著优于订单流算法因子。
  • 剔除涨跌停股后,反转因子表现稳定,避免极端行情影响。


BVC算法在冲击成本模型中的应用 [page::35][page::36]


  • 使用BVC算法得到的净主买数据作为Istar模型的订单流指标,显著提升了模型拟合优度。

- 方程1(瞬时冲击)的OLS R²由订单流算法的2.3%提升至BVC的22.8%;方程2稍有下降,但整体解释力提高。
  • 表明BVC算法更适合描述订单冲击成本,尤其在中小市值股票中表现更优。


风险提示及研究限制 [page::0][page::38]

  • 量化模型基于历史数据,未来可能失效。

- 极端市场环境下因子表现和冲击成本估计可能受干扰,投资者需注意风险控制。

深度阅读

主动买卖单的批量成交划分法研究报告深度分析



---

一、元数据与报告概览


  • 报告标题:主动买卖单的批量成交划分法

- 作者及联系方式:朱剑涛,东方证券研究所,电话021-633258886077,邮箱zhujiantao@orientsec.com.cn
  • 发布日期:2020年02月26日

- 研究机构:东方证券研究所
  • 研究主题:买卖单方向判别方法,重点研究主动买卖单划分算法,比较批量成交划分法(BVC)与逐笔算法(尤其订单流算法)的优劣及其对Alpha因子构建的影响。


核心论点
  • 主动买卖单划分方法主要分为逐笔算法和批量成交划分法(BVC)。

- BVC算法,依据区间内总成交量和标准化价格变动概率分布确定主动买卖占比,更适合复杂电子委托交易市场。
  • BVC算法得到的净主买占比(OI)在与股价涨跌幅匹配度、方向判定准确性、Alpha因子效力及交易冲击成本模型拟合中均优于订单流算法。

- BVC算法因子对小市值股票表现更优,因子持有期短,且因子衰减速度比传统反转和流动性因子慢,适合构建低换手率的有效投资组合。

[page::0,1,2]

---

二、逐节深度解读



2.1 主动买卖单划分方法概述



主动买卖单根据成交价格动作分为主动买单(主动买入)和主动卖单(主动卖出)。划分方法分为:
  • 逐笔算法:针对每笔交易单独判断方向,结果分散。根据数据依赖度分为:

- 成交价比较法(Tick Rule,Blume 1989):根据价格变动方向判定交易方向,优点是简单数据需求低,但在价格无变动时方向易被误判,且忽略委托报价信息。
- 报价比较法(Quote Rule,Hasbrouck 1988):基于成交价相对于买卖报价中点位置判定方向,利用报价信息更全面,但报价驱动市场设计,委托驱动市场中报价频繁修正导致适用性差。
- Lee-Ready判别法(1991):结合上述两法,先用报价法,若价格在报价中点则用成交价比较法补充,适合报价驱动市场,委托驱动市场中适用性较低。
  • 批量成交划分法(BVC,ELO 2012)

- 不判断每笔,而是对时间或成交量间隔内的总成交量根据股价的标准化变动概率分布,计算主动买入和卖出的占比。
- 公式基于t分布的累积分布函数,用股价涨跌幅归一化后相对于股价波动决定主动买入占比。涨停或跌停时考虑特殊判断。
- 优点是降低逐笔算法因高频交易、订单拆分等噪音带来的划分错误,更适用于电子委托驱动市场。

文献评述
  • 传统逐笔算法在委托驱动电子交易市场中计算量大且存在偏差,实际结果偏低估买方驱动交易概率。

- BVC算法以较少计算量提供连续型买卖方向估计,与信息驱动的价格变动相关性更强。
  • 也有研究认为逐笔法(成交价比较法+Lee-Ready)精度更好,但多数研究认可BVC在处理高频噪音和连续买卖力量估计上的优势。


[page::2-5]

---

2.2 BVC算法与订单流算法的比较


  • 计算尺度

- 逐笔算法产生离散每笔交易的方向,BVC产生区间(本文以1分钟为单位)内的主动买卖占比。
- 比较时将逐笔结果集合成1分钟的主动买卖占比与BVC衡量值对比。
  • 数据处理

- 剔除涨跌停、无成交小时间段数据。
- 涨停时默认全部成交为主动卖,跌停时为主动买。
  • 订单流算法

- 采用Wind数据,基本基于Lee-Ready规则,买一价卖一价判断成交方向。

评价标准
  • 国内无做市商制度,无法获取真实交易者下单方向,只能通过净主买占比和价格涨跌相关性间接验证。

- 理论上买卖方向的净主买占比应与股价涨跌趋势高度一致,因为主动买单推动股价上涨,主动卖单推动股价下降。

[page::5-6]

---

2.3 相关性分析


  • 核心数据

- BVC算法日度净主买占比与日内股价涨跌幅的回归拟合优度R²为54%,订单流算法为36%。
- 相关系数BVC为73%,订单流59%,BVC明显优于订单流。
- 散点图显示绝大多数股票BVC拟合度高于订单流。

意义
  • BVC算法所反映的买卖方向更有效揭示市场对价格变动的推动力。

- 订单流算法虽未直接用到价格变动信息,但仍有60%的相关性,表明逐笔成交也能部分反映价格形成。

图1

[page::7]

---

2.4 方向匹配程度分析(日内和日间)



日内:


  • BVC算法净主买占比与当日股价涨跌方向不一致概率低于订单流算法:

- 股价上涨时,BVC误判概率24%,订单流38%。
- 股价下跌时,BVC略高于订单流,但均较低。
  • 错误判断时,BVC误判净主买占比数值绝对值远低于订单流,表明BVC的错误度较轻。


日间(月度):


  • 两算法与月度股价涨跌方向匹配度明显下降,但BVC依旧优于订单流。

- 订单流算法错误判断股价上涨方向时,判负概率高达85%,BVC仅50%。

方向不一致案例示范:


  • 多个股票短期大涨大跌案例中,BVC方向判断更符合实际价格走势,订单流方向出现明显偏差。


图2
图4
…(详见同类图5-11页)[page::8-13]

---

3、Alpha因子测试



构建基于买卖单数据的四种主要日度因子:
  • 净主买占比OI (主动买-主动卖)/成交量,带方向性。

- 主动买卖差额占比|OI|:绝对值,衡量多空主动成交不平衡。
  • 净换手率NTO:净主买量/流通股本,结合换手率与方向。

- 多空力量差异度|NTO|:NTO取绝对值,衡量买卖力量差异强弱。

3.1 净主买占比因子表现


  • BVC算法构造的OI因子表现显著优于订单流,ICIR绝对值峰值在1.5以上,多空组合年化收益超过15%,最大回撤较低。

- 订单流算法OI因子大部分周期ICIR不足0.5,无明显选股能力。
  • 净主买占比因子表现为负向IC,表明在无做市商机制市场中净主买对未来收益有反转预示,符合中国市场羊群效应的研究文献。

- 因子短期效力更强(5-20交易日周期最佳),长期60-120交易日表现弱。

3.2 不同市值股票池效应


  • 小市值(中证500以下)股票池中因子效果明显强于大盘,沪深300市值大盘中OI因子表现无效。

- OI因子分组收益中空头端贡献的负超额最大,多头端也有明显正超额,反映正确方向判断能力。

3.3 主动买卖差额因子|OI|


  • 普遍选股效果弱,ICIR低于1,显示该因子易受多空震荡影响。


3.4 净换手率NTO因子


  • BVC构造的NTO因子表现优于订单流,除120日周期外,ICIR多在1以上,年化收益约13-16%。

- NTO因子IC方向与OI相反,但因子表现可靠性略次于OI因子。

3.5 多空力量差异度|NTO|


  • 绝对值因子表现大幅提升,ICIR超3,年化多空收益20%+,最大回撤<10%。

- 反映买卖力量均衡度越高,股票后续表现越好。

图12-31[page::14-31]

---

3.6 因子衰减分析


  • BVC算法OI20和NTO20因子信息衰减较慢,半衰期明显高于反转和流动性因子。

- 使用指数拟合IC衰减序列,R²约80%,说明拟合准确。
  • 有利于构建低换手率组合,适合中短周期选股。


图33-35

图34

---

3.7 高频因子表现(短周期持有)


  • 持有期越短,BVC算法OI和NTO因子ICIR越高,持有1日ICIR最高,例如OI5持有1日ICIR达-10.06,NTO5达-10.27,表现与反转因子相当。

- 订单流算法短周期因子效力明显减弱。
  • 说明委托驱动市场下,主动交易信息在短期内被充分反映,适用于短线选股策略。


图36

---

四、在冲击成本模型中的应用



使用Istar模型衡量交易冲击成本,其中关键变量为主动净流入量S。回归分析分为两方程:
  • 方程1度量交易瞬时冲击I

- 方程2度量市场最终承担的交易冲击成本MI。

回归结果显示,使用BVC算法计算的净主买数据对方程1的解释力大幅提升(300指数成分股从2.3%提升至22.8%),方程2解释力略有下降,但综合整体解释力提高,说明BVC算法更适合用于实证交易成本模型。

图38

[page::35-36]

---

五、风险因素评估


  • 模型失效风险:基于历史数据构建的量化模型存在未来失效风险。

- 极端市场冲击:在极端市场状况下模型表现可能波动剧烈,导致投资亏损。
  • 建议投资者密切关注模型实际表现并适时调整策略。


[page::38]

---

六、批判性视角与细节


  • 虽然BVC算法在多数指标上优于订单流算法,但部分学术研究(如Chakrabarty等2015)指出成交价比较法及Lee-Ready法在部分指标上精度更高,表明算法优劣可能与市场类型、交易机制密切相关,需谨慎推广。

- 报告强调BVC算法在无做市商、委托驱动的电子市场环境下的优势,但部分结论可能不适于做市商制度完善的市场。
  • OI因子负向IC的解读符合中国市场羊群效应,但对投资者而言,此反转特性需谨慎使用,过度依赖反转可能损害收益。

- 订单流算法因子的截面衰退和异常波动表明该方法可能低估了某些噪声因素的影响,从统计上存在不足。
  • 报告中高频因子短周期表现优越的结论,需注意实际交易时的冲击成本和执行风险,只有配套低滑点执行策略时该优势方能发挥。


---

七、结论性综合



本研究系统比较了逐笔划分法(特别是订单流算法)和批量成交划分法(BVC算法)在中国A股委托驱动电子交易市场中的应用效果。核心发现如下:
  • BVC算法优势显著

- 通过采用基于时间间隔内成交量和标准化股价涨跌概率的划分方式,BVC算法在股价涨跌幅相关性、方向判断准确率及错误幅度等指标上均优于订单流算法。
- BVC算法的连续性划分方式降低了高频交易噪音的影响,更适合当前中国市场的行情特征。
  • Alpha因子效能优于订单流算法

- 基于BVC计算的净主买占比(OI)和净换手率(NTO)因子在全市场及小市值板块均表现出持续、稳定的选股能力,ICIR普遍超过1.0,年化收益率普遍超过12%。
- OI因子体现了市场反转特征,负向IC体现买入压力过大后短期内收益反转,可为投资者提供中短期交易信号。
- 多空力量差异度(NTO绝对值)因子表明,力量均衡状态下股票未来表现更佳,适用于风险调整型投资策略。
  • 因子周期与持有期特征

- 因子表现以5-20交易日短中期为最佳,较长周期信息消化完毕,难以形成投资超额收益。
- 高频短期持有因子表现卓越,符合无做市商电子委托市场中主动交易快速表达市场信息的机制。
  • 组合构建与风险指标

- BVC算法衰减速度较慢,适合构建低换手率且稳健的股票池组合,兼顾收益与交易成本控制。
- 在Istar交易冲击成本模型中,BVC算法明显提升模型的拟合效果,体现其在微观结构研究和实盘交易中应用的合理性。
  • 应用限制和风险

- 量化模型依赖历史数据,未来存潜在失效风险,极端市场环境可能导致模型性能骤降。
- 订单流算法尽管存在不足,但在部分市场环境或细分应用中可能仍具参考价值,综合应用需谨慎。

整体来看,BVC算法及基于其构造的Alpha因子为中国委托驱动电子交易市场的主动买卖行为研究和投资决策提供了更丰富、准确的信息,有助于提升选股效率和风险管理能力。

---

主要图表索引


  • 图1(第7页):BVC算法和订单流算法日度净主买占比与日内股价涨跌幅相关性对比。

- 图2-11(第9-13页):两算法方向判断失误概率及典型案例对比。
  • 图12-31(第14-31页):Alpha因子表现、分组收益、不同市值股票池因子表现和因子相关性分析。

- 图33-35(第31-33页):因子IC衰减示意及指数拟合。
  • 图36-37(第34-35页):短周期因子表现及剔除涨跌停效应。

- 图38(第36页):Istar模型拟合效果对比。

---

溯源说明



本文所有数据引用均标注对应页码,便于追溯与核查,例如[page::2,7,14,26,36,38]。

---

总结



东方证券研究所朱剑涛等人通过严谨的实证方法和丰富的数据分析,证明了BVC批量成交划分法在中国A股电子委托交易市场的优越性,以及基于该算法构建的买卖单方向Alpha因子的预测力和实用价值。该研究成果为微观结构金融研究、量化投资策略开发以及实盘交易成本控制奠定了坚实基础,具有重要理论和实践意义。投资者应结合自身风险偏好和市场环境,合理运用相关因子及算法,实现盈利与风险的优化平衡。

报告