`

海量Level 2数据因子挖掘系列(四)——竞价相关因子

创建于 更新于

摘要

本报告基于深证A指成分股海量Level 2逐笔订单数据,构建了15个集合竞价相关因子,涵盖开盘和收盘不同竞价时段的委托、成交和撤单行为。通过2019年3月至2024年5月的历史回测,多个因子表现出稳定的负向RankIC以及选股能力,尤其是买单方向因子在开盘集合竞价阶段表现突出,收盘卖单方向因子则体现出较强看空信号。此外,集合竞价因子与传统大小单和长短单因子相关度较低,具备独立新信息价值,回测组合在多样化选股规模下实现了显著超额收益和良好风险调整表现。报告对竞价因子在量化选股中的应用提出了新思路,并强调策略潜在的市场结构风险 [page::0][page::6][page::9][page::20]

速读内容


Level 2数据及集合竞价时段介绍 [page::3][page::5]

  • Level 2数据提供比Level 1更丰富的快照和逐笔订单信息,是行情数据的根源。

- A股竞价时段分为开盘集合竞价(09:15-09:25)和收盘集合竞价(14:57-15:00),部分时段内可撤单,部分时段不可撤单。
  • 集合竞价阶段的委托、成交、撤单反映日内个股活跃度并与后续走势相关。


竞价相关因子构建与定义 [page::5]

  • 构建15个集合竞价因子,包括成交比例、撤单比例等,并依据时段分为4类因子组。

- 因子针对深交所结构开发,具体因子定义及计算涉及委托、成交和撤单订单比率。

竞价因子选股表现统计 [page::6][page::9]

  • 09:15-09:20时段买单方向因子表现最佳,20日平滑换仓RankIC均值约-9.2%,胜率22%-27%不等。

- 09:20-09:25时段买卖双向因子表现突出,20日RankIC均值约-9.2%,胜率28%。
  • 14:57-15:00收盘时段卖单方向因子具较强看空信号,RankIC均值约-9.6%,胜率23%,而买单方向因子无显著选股能力。

- 因子与大小单及长短单因子相关系数均较低(-30%~30%),且与Barra风格因子相关性偏低,说明因子具有独立有效信息。

代表因子回测绩效:BuyTransactionBuyOrderratio09150920 [page::9][page::10]




| 组合 | 总收益 | 年化收益率 | 最大回撤率 | 平均换手率 | 年化波动率 | 夏普比率 | 信息比率 |
|------------|---------|------------|------------|------------|------------|----------|----------|
| Top30 | 41.05% | 6.73% | 39.31% | 95.73% | 19.33% | 0.22 | 0.35 |
| Top50 | 35.43% | 5.91% | 38.63% | 93.75% | 19.18% | 0.18 | 0.31 |
| Top100 | 34.82% | 5.82% | 36.64% | 90.11% | 18.98% | 0.17 | |
| Top150 | 33.71% | 5.65% | 35.68% | 90.92% | 18.83% | -0.38 | 0.30 |
| Top200 | 34.80% | 5.81% | 34.52% | 83.77% | 18.70% | 0.18 | 0.31 |
  • 说明买单方向成交比例因子具备稳定选股能力,超额收益显著,换手率和波动适中。


其他重点因子表现摘要 [page::11][page::12][page::14][page::18]

  • BuyWithdrewBuyOrderratio09150920因子年化收益率最高达11.88%,最大回撤32.13%,表现优异。

- TransactionOrderratio09200925及BuyTransactionBuyOrderratio09150925等因子也呈现5%-9%以上的超额年化收益。
  • SellTransactionSellOrderratio_14571500因子对卖单成交比例的利用,体现了收盘竞价时段的看空信号,相关组合年化超额收益9%-10%。


风险提示与未来展望 [page::0][page::20][page::21]

  • 因子基于历史数据量化模型构建,存在政策、市场结构变化导致失效风险。

- 报告强调持续挖掘Level 2数据潜力,构建更多有效因子以提升选股质量和投资决策支持。

深度阅读

广发证券“海量Level 2数据因子挖掘系列(四)——竞价相关因子”报告详尽分析



---

一、元数据与报告概览



报告标题: 竞价相关因子——海量Level 2数据因子挖掘系列(四)
作者及机构: 由广发证券发展研究中心金融工程研究小组完成,主要分析师包括罗军、安宁宁等资深人员
发布日期: 2024年8月及其前后,报告数据覆盖2019年3月至2024年5月
主题内容: 本报告聚焦中国A股市场中集合竞价时段的Level 2逐笔订单数据,通过挖掘集合竞价开盘与收盘期间的委托成交撤单数据,构建15个竞价相关因子,研究这些因子在深证A指成分股中的选股效果。
核心论点与结论:
  • Level 2数据,尤其是逐笔订单数据,是挖掘市场微观交易信号的关键。

- 集合竞价阶段(区别于连续竞价阶段)的买卖订单特性与未来股价走势存在关联。
  • 依据15个因子的实证统计结果,部分因子尤其是开盘买单方向相关因子表现显著,拥有一定选股能力,部分卖单方向因子在收盘竞价阶段也表现出看空信号。

- 这些因子与此前提出的大小单、长短单因子相关性低,具有独立的信息价值。
  • 报告警示因市场政策和环境变化可能导致模型失效,强调策略的适用性风险。


[page::0,1,6,20]

---

二、逐节深入解读



1. Level 1 & Level 2行情数据介绍(第3-4页)


  • 关键论点: Level 2数据较Level 1数据在频率和信息量上有显著优势,尤其逐笔订单数据提供了市场交易的最原始信号(如逐笔价格、成交量、撤单信息等),是研究集合竞价的重要数据基础。

- 具体内容与对比:
- Level 1为3秒快照,包括基本价量信息和5档买卖盘;
- Level 2提供10档买卖盘及前50笔委托、撤单信息,且包含逐笔订单明细,精确到毫秒。
- 逐笔订单是后续因子挖掘的根基。
  • 逻辑与假设: 通过更高频、更丰富的数据源,能更有效捕捉和利用市场微结构信息,潜在地提升选股策略的有效性。

- 表1解读: 清晰展示Level 1与Level 2快照及逐笔订单数据的覆盖维度差异,对后续因子构建提供了数据基础说明。
[page::3,4]

2. 相关研究回顾(第4页)


  • 报告承接此前三篇系列报告,内容涵盖多维度解耦大小单因子、长短单因子及二者碰撞火花因子,共计构建上百个基于逐笔订单数据的因子。

- 这些因子整体表现优异,具备较高的RankIC均值(9%-13%)和胜率(76%-80%),为本报告集合竞价因子的研究提供了方法论与技术基础。
[page::4]

3. 集合竞价时段与因子定义(第5-6页)


  • A股集合竞价时段分为开盘(09:15~09:25,拆分为09:15~09:20和09:20~09:25)和收盘(14:57~15:00)三段。

- 09:15~09:20期间可撤单,09:20~09:25及收盘阶段不可撤单。
  • 15个因子由委托成交撤单数据构成,均基于深证A指成分股逐笔订单数据构建,因交易所间数据结构差异,仅针对深交所股票适用。

- 表3分时段整理,表4给出了因子名称,定义细节需联系作者,但均围绕买卖方向的成交比例、撤单比例等构建。
[page::5,6]

4. 集合竞价因子选股表现统计(第6-20页)


  • 总体表现:

- 15个因子均展示了一定的选股能力,RankIC均值在-0.03~-0.10区间,胜率超过20%,基于20日平滑换仓数据进行统计,表现稳定。
- 开盘选股因子表现优于收盘,总体上买单方向因子效果明显,尤其是09:15~09:25时段,卖单因子在收盘期体现出看空信号。
  • 具体因子表现示例:

- BuyTransactionBuyOrderratio09150920因子分档收益图(图1),五十档分档组合收益呈现明显单调递减趋势,反映因子具有明显分层能力。
- 该因子不同规模组合在2019年至2024年表现出5.6%至6.7%年化超额收益,最大回撤控制在30%-40%范围,换手率较高(约90%以上),表明该因子可构建活跃度较高的多头组合。夏普比率合理,信息比率介于0.3-0.4之间,风险调整表现稳健。
- BuyWithdrew
BuyOrderratio09150920因子表现优于前者,年化年收益率最高达11.88%,且最大回撤较前者更低。
- 收盘SellTransactionSellOrderratio14571500因子表现突出,分档收益优异,年化超额收益达8.6%-10.9%,意味着卖单成交比例高的股票具有较强的未来看空信号。
  • 分年度表现: 因子选股效果在不同年份略有波动,尤其在2020年表现欠佳,但整体仍优于基准指数。

- 提示: 高换手率策略更适合机构量化交易,投资者需注意交易成本和滑点风险。
[page::6,9-20]

5. 集合竞价因子与其他因子相关性分析(第7-8页)


  • 与前面大小单因子、长短单因子相关性低(-0.13至0.11区间),显示集合竞价因子提供独立信息。

- 与Barra八大风格因子相关性偏低,最高达约29%(流动性、波动率、市值因子),说明竞价因子不同于传统风格因子,添加多样化选股思路。
[page::7,8]

6. 总结与风险提示(第20-21页)


  • Level 2逐笔订单能捕捉更细致的市场交易信息,尤其集合竞价阶段的订单信息能有效辅助预测短期股价表现。

- 多时段竞价因子均展现一定选股能力,开盘买单方向因子优势明显,收盘卖单方向因子有助发现潜在下跌压力。
  • 结构和环境变化可能导致因子失效,模型适应性与稳健性需持续验证。

[page::20,21]

---

三、关键图表深度解读



图1(BuyTransactionBuyOrderratio09150920因子50档分档收益)


  • 描述: 图表展示了以该因子值排序后,将深证A指成分股分为50档,计算每档组合的超额收益。

- 结果: 第1档因子值最高的股票组收益远高于第50档,收益呈明显单调递减,表明因子有效区分不同股票未来表现。
  • 意义: 强因子的显著分层能力说明该因子在样本内具备良好风险调整后收益预示能力。


[page::9]

图2(BuyTransactionBuyOrderratio09150920净值表现)


  • 描述: 各Top-K组合(30, 50, 100等)以及深证A指指数净值走势对比

- 结果: Top-30组合表现最优,净值稳步攀升,多年累计超额收益显著领先指数;组合间波动较小,说明规模扩大后效果保持稳定。
  • 关联文本: 体现前文超额收益统计的动态过程,支持因子稳定性。


[page::10]

图3和图4(BuyWithdrewBuyOrderratio09150920因子)


  • 分档收益图(图3)和净值表现图(图4)类似图1、图2,且多数指标优于BuyTransaction因子,反映买单撤单比例在竞价行情中同样存在较强信息含量。



[page::12]

图5和图6(TransactionOrderratio09200925因子)


  • 同样展示因子对深证A指成分股50档收益与净值累计表现,均展现良好稳定的分层及选股能力。



[page::14]

图7和图8(BuyTransactionBuyOrderratio09150925因子)


  • 延续开盘09:20-09:25不可撤单时段因子表现,分档收益单调清晰,净值曲线多阶段领先指数。说明开盘后半段竞价阶段因子仍具选股信息。



[page::16]

图9和图10(SellTransactionSellOrderratio_14571500因子)


  • 收盘阶段卖单成交比重因子,五十档收益递减明显,净值表现稳健优于指数。验证了卖单成交比例作为负向信号在收盘竞价期具有预测力。



[page::18]

---

四、估值部分



报告重点为因子挖掘与因子表现验证,未涉及公司估值或传统估值模型(DCF、市盈率等),故不包含估值分析章节。

---

五、风险因素评估



报告明确指出以下风险:
  1. 政策及环境风险: 因子基于历史数据统计和模型构建,市场政策或环境变动可能导致模型失效。

2. 市场与结构变化风险: 交易行为、市场结构改变或数据规则调整,可能使得因子失去效果。
  1. 模型差异风险: 本报告因子和策略观点可能与其他量化模型存有分歧,投资者需谨慎对比并综合判断。


报告未详细提供风险缓解策略,但强调了模型适用性的动态变化和对市场变化敏感性,提示用户动态跟踪和调整。
[page::0,21]

---

六、审慎视角与细微之处


  • 负向RankIC解释: 报告中因子RankIC均为负值(如-9%等),这可能是因因子定义与未来收益的负相关方向。例如买单成交比例较高时预示未来股价可能回落,或者因子定义以卖空视角计量。报告中未详细解释负向RankIC的经济含义,需读者结合因子构造深刻理解。

- 策略交易成本: 报告组合换手率极高,达到90%以上,意味频繁换仓,高交易成本和滑点对实际收益有较大影响,策略应用需兼顾执行效率。
  • 因子间低相关性: 集合竞价因子与大小单、长短单因子相关度低,表明新因子拓展了信息维度,减少了过度依赖单一信号风险。

- 时间窗口及数据局限: 分析集中在深证A指成分股,且涉及的Level 2数据仅涵盖深交所,未涵盖上交所差异数据,限制了结论的全面适用性。
  • 异常年份表现波动: 部分年份(如2020年)因子表现明显下降,提示在极端市场或特殊窗口期因子稳定性需进一步验证。


---

七、结论性综合



本报告系统展示了基于中国A股市场集合竞价时段Level 2逐笔订单数据,构建的15个竞价相关因子的定义及选股表现。通过对2019年至2024年深证A指成分股的严谨统计实证,可见:
  • 核心发现在于集合竞价阶段买卖订单的委托、成交、撤单行为内含价格未来走势信息。 开盘09:15~09:25时段的买单成交及撤单方向相关因子表现尤为突出,拥有较好的负向RankIC和分档收益单调性,年化选股超额收益可达6%-12%。

- 收盘阶段的卖单成交比例因子表现出较强的选空能力,显示卖方力量在收盘竞价的压力体现。
  • 集合竞价因子的独立性较强,与既有大小单因子、长短单因子以及传统风格因子保持较低相关性,显示其补充了额外有价值的市场信息。

- 报告提供了详尽的分档收益图表与多年度分年度表现数据,体现了因子策略的稳定性与周期适应性。
  • 组合风险指标提示策略具有一定的波动与最大回撤,且换手率极高,表明策略适合主动量化运营,需要注意执行成本的管理。


根据报告内容,利用集合竞价订单数据挖掘出的因子为量化选股提供了新的工具和思路,尤其在开盘集合竞价阶段的买单行为和收盘卖单行为中蕴含较强的未来价格预示信息。但鉴于模型依赖于历史数据规律,且受市场环境和政策变化影响较大,建议投资者结合自身风险偏好及实盘条件,动态调整因子组合并做好风险管控。未来,海量Level 2数据因子挖掘系列将持续探索更多微观市场信号,完善量化投资工具箱。

---

参考文献与数据来源


  • Level 1与Level 2行情数据对比及因子逻辑由广发证券发展研究中心提供。

- 统计数据与回测结果基于通联数据、Wind数据库。
  • 研究报告由广发证券资深分析师安宁宁领衔完成。


[page::0-22]

---

结束语



本报告通过严谨的数据分析与量化方法,揭示了A股集合竞价阶段订单行为对股价走势具有显著预判能力,在实际量化投资中为因子构建和策略开发提供了重要支持。完整理解本报告需结合深入的微观市场结构知识及统计分析习惯,方能充分发挥数据因子的投资价值。

报告