【广发金工】2024精选深度报告系列之十五 集合竞价相关因子
创建于 更新于
摘要
本报告基于深交所Level 2逐笔订单数据,构建15个集合竞价相关因子,重点分析了不同竞价时段买卖单成交比例和撤单比例因子的选股性能。通过对深证A指成分股2019年至2024年期间的回测显示,部分集合竞价因子具备稳定的选股能力,取得显著的超额收益,且该因子体系与大小单及Barra风格因子相关性较低,具备独立有效性[page::0][page::4][page::6][page::7][page::17]。
速读内容
- 量化背景与Level 2数据说明:股票市场的博弈关键在于数据的全面收集与深度分析,Level 2数据包含逐笔订单等丰富信息,是挖掘市场规律的重要来源[page::0][page::1][page::2].
- 集合竞价时段及因子构建:A股集合竞价分为开盘集合竞价(09:15~09:25,其中09:15~09:20时可撤单,09:20~09:25不可撤单)及收盘集合竞价(14:57~15:00不可撤单)。基于委托、成交、撤单数据构建15个相关因子[page::0][page::3].
- 交易因子表现与回测策略:因子选取深证A指成分股,采用5日滚动均值因子,20交易日换仓,考虑双边交易成本0.3‰。回测区间2019年3月至2024年5月,构建Top-K等权组合,评估因子超额年化收益和分档收益表现[page::6][page::7][page::8].
- 关键因子表现示例:
- BuyTransactionBuyOrderratio09150920因子表现优异,50档分位收益单调递减,Top-30组合年化超额收益6.73%,且净值曲线明显跑赢基准指数。


- BuyWithdrewBuyOrderratio09150920因子同样表现良好,Top-30组合年化超额收益达11.88%。


- TransactionOrderratio09200925因子显示稳健的分档收益表现,Top-30组合超额年化收益6.49%。


- SellTransactionSellOrderratio14571500因子用于收盘集合竞价阶段,表现同样较强,Top-30组合超额年化收益10.90%。


- 因子独立性分析:集合竞价因子与大小单因子相关系数介于-13%至11%,与长短单因子相关系数介于-30%至30%,与Barra风格因子相关系数介于-7%至29%,显示集合竞价因子具有高度独立性[page::5][page::6].
- 交易时段差异与因子效果:
- 09:15~09:20可撤单阶段,买单方向因子表现较佳,RankIC均值约-9.2%,胜率22%-27%。
- 09:20~09:25不可撤单阶段,买卖双向因子表现较佳,RankIC约-9.2%,胜率28%。
- 14:57~15:00收盘竞价,买单方向因子无明显选股能力(RankIC近0,胜率50%),但卖单方向因子表现较好(RankIC约-9.6%,胜率23%),卖单成交比例较大与未来股价下跌相关[page::0][page::4][page::17].
- 风险提示:因策略基于历史数据的统计和建模,面临市场环境变化、政策调整及行为结构变化导致模型失效风险,且与其他量化模型结论可能存在差异[page::0][page::1][page::17].
深度阅读
【广发金工】2024精选深度报告系列之十五 集合竞价相关因子 分析报告
---
一、元数据与报告概览
- 报告标题:《集合竞价相关因子:海量Level 2数据因子挖掘系列(四)》
- 作者:广发金融工程研究团队
- 发布机构:广发证券,金融工程研究中心
- 发布日期:2024年09月26日
- 主题:基于A股集合竞价时段的Level 2逐笔订单数据,构建一批集合竞价相关的量化选股因子,探讨其与后续股价走势之间的关系及选股能力。
- 核心观点:本文基于海量Level 2数据中的逐笔订单信息,结合集合竞价阶段内的委托、成交和撤单数据,设计并构造了15个集合竞价相关因子,针对深证A指成分股进行了多年的回测。实证结果显示,这些因子在不同竞价时段表现出不同的选股性能,特别强调了买单和卖单成交比例因子的异质性表现,具有一定的股票未来走势预测价值。
- 评级及目标价:报告无明确股票评级和目标价,侧重于因子挖掘与量化选股模型的研究。
- 主要信息传达:通过对集合竞价阶段多维度的订单行为数据进行因子构建和统计回测,揭示竞价时段内微观交易行为与股票未来表现之间的关联,为量化投资提供新的数据因子来源和选股策略思路。
---
二、逐节深度解读
1. 摘要与引言
- 关键论点:股票市场博弈的胜出关键在于全面的数据收集与数学建模能力,Level 1数据频率相对低且信息有限,Level 2数据提供更丰富和更细粒度的订单级信息,是挖掘有效因子的关键数据源。集合竞价阶段的买卖委托、成交、撤单行为反应了个股盘初及收盘活跃度,与未来股价走势存在关联。
- 逻辑支撑:通过利用Level 2逐笔订单数据,研究集合竞价阶段的价格发现过程和订单行为,提炼关键数据因子以反映潜在的价格驱动。报告强调数据结构差异、时间段特殊性(可撤销和不可撤销时段)对因子设计的影响。[page::0][page::1]
2. Level 1与Level 2行情数据介绍(第1-2页)
- 内容总结:Level 1行情数据为3秒快照,数据粒度有限,仅包含市场最优五档买卖价及量;Level 2数据频率更高,内容更丰富,涵盖10档买卖报价、最优买卖价前50笔委托、撤单信息及逐笔订单的细节(含毫秒级时间戳、委托编号、价格、买卖方向等)。
- 推理依据:Level 2逐笔订单数据是构建微观交易行为因子的基础,更能体现市场的实时价格发现机制,提供更为详尽的成交与委托信息,有利于挖掘具备超额收益的交易信号和因子。[page::1][page::2]
3. 集合竞价因子定义(第3-4页)
- 市场背景:A股竞价时段分为集合竞价和连续竞价,其中集合竞价包含开盘集合竞价和收盘集合竞价;开盘集合竞价09:15~09:20时段可撤单,09:20~09:25以及收盘集合竞价14:57~15:00时段不可撤单。
- 因子构建:基于这一市场结构,文章构造了15个相关因子,均利用集合竞价时段的委托、成交、撤单数据解析市场信息,反映个股活跃度及可能的价格影响。考虑数据差异,只做深证A指成分股范围的实证。
- 关键假设与逻辑:集合竞价行为的订单流反映了投资者开盘与收盘的定价预期及市场情绪,关注成交与撤单占比的因子有助于揭示未来走势。[page::3][page::4]
4. 因子回测表现(第4-6页)
- 回测区间及范围:2019年3月至2024年5月,深证A指成分股。
- 主要指标定义:报告重点列出各因子20日平滑换仓RankIC(排序指标的相关系数)和胜率(因子正确预测涨跌个数占比)。
- 核心数据点:
- 09:15~09:20可撤单时段,买单方向的成交比例因子RankIC均值为-9.2%,胜率22%;撤单比例中买单方向因子表现也较好,RankIC均值-5.0%,胜率27%。
- 09:20~09:25不可撤单时段,成交比例因子结合买卖双向考虑,RankIC均值为-9.2%,胜率28%。
- 09:15~09:25整体时段,买单方向成交比例因子表现最好,RankIC均值-10.1%,胜率28%。
- 14:57~15:00收盘不可撤单时段,买单方向因子选股能力弱(RankIC接近0,胜率约50%),卖单方向成交比例因子表现较强,RankIC均值-9.6%,胜率23%。
- 推断与理解:不同竞价时段的买卖方向因子选股效力存在明显分化,特别收盘卖单因子的负向预测指标暗示卖单越多未来股价看空可能越强。[page::4][page::5][page::6]
5. 因子相关性(第5-6页)
- 与前期研究《多维度解耦的94个大小单因子》和《订单维度解耦的22个大小单因子》中的因子相关性较低,且与Barra风格因子相关度均较低,除流动性、波动率、市值因子略有提升。
- 含义:集合竞价因子在信息内容上具有独立性和补充价值,可为量化模型提供新的Alpha源。[page::5][page::6]
6. 因子选股实证(第6-15页)
报告重点展示了5个典型集合竞价因子的50档分档收益与净值表现图,分别为:
- BuyTransactionBuyOrderratio09150920(09:15-09:20买单成交比例)
- 50档分档图显示收益单调递减,Top组合相对深证A指超额年化收益达最高6.73%。
- 净值曲线稳健呈上升趋势,明显跑赢基准(深证A指)。[page::7][page::8]
- BuyWithdrewBuyOrderratio09150920(09:15-09:20买单撤单比例)
- 单调性良好,Top-30组合超额年化收益最高达11.88%。
- 净值表现优异,领先基准较多,展现更强选股能力。[page::8][page::9]
- TransactionOrderratio09200925(09:20-09:25买卖成交比例)
- 选股收益单调,Top-30超额年化收益6.49%。
- 净值曲线表现持续跑赢指数,体现因子有效性。[page::10][page::11]
- BuyTransactionBuyOrderratio09150925(09:15-09:25买单成交比例)
- 超额收益较为稳定,Top-30达到5.63%,呈单调分布趋势。[page::12][page::13]
- SellTransactionSellOrderratio14571500(14:57-15:00卖单成交比例)
- 收盘竞价卖单因子表现出显著的负向预测能力,超额年化收益最高达到10.90%。
- 净值表现显示Top组合明显跑赢基准,确认收盘时卖盘行为的预警信号效力。[page::14][page::15]
- 整体结论:这些集合竞价因子通过排序和定期换仓,能够构建出显著跑赢市场的股票组合,既验证了因子的统计显著性,也体现了实际投资应用价值。
7. 论文总结与展望(第16-17页)
- 总结:
- Level 2数据相对于Level 1数据信息丰富,是挖掘推进因子的核心。
- A股集合竞价分不同阶段,每阶段因子表现不同。
- 买卖方向及委托/成交/撤单比例等视角有助于提炼预测信号。
- 收盘卖单成交比例因子尤其表现出较强负向预测能力。
- 未来方向:
- 将继续深挖Level 2数据,发掘更多价格趋势及交易行为的信息。
- 推展海量因子挖掘体系,助力量化投资和股票组合构建。
- 风险提示:
- 策略基于历史数据统计,政策和市场环境变化可能导致信号失效。
- 结构和交易行为变动可能影响模型适用性。
- 不同量化模型可能得出不同结论,结果须审慎使用。[page::16][page::17]
---
三、图表深度解读
表1-Level 1与Level 2数据对比(第2页)
- 详细比较Level 1与Level 2数据内容和频率,明确Level 2的数据优势,为后续因子构建提供数据基础。
表3-A股竞价时段划分(第3页)
- 展示开盘集合竞价09:15-09:25及收盘集合竞价14:57-15:00时段的交易规则差异,说明不可撤销时段对因子设计的影响。
表4-15个集合竞价相关因子定义(第4页)
- 列明因子名称、计算方法及涵盖的竞价时段,是报告方法架构的核心。
表5-13 因子统计与相关性(第5~6页)
- 支撑因子独立性,不重复于大小单因子及Barra风格因子,说明因子增量价值。
图1-10(第7~15页)
- 多个因子分档收益柱状图(如图1、3、5、7、9)揭示因子值与股票后续收益的负相关趋势,说明因子有效性。
- 净值曲线(图2、4、6、8、10)均显示整体上跑赢基准,且分档组合表现差异明显,进一步验证因子筛选的投资意义。
---
四、估值分析
本报告为量化因子研究报告,未涉及传统财务估值方法(如DCF、市盈率等)。因子表现通过RankIC及年化超额收益率体现其投资价值,应用于股票排序与组合构建。
---
五、风险因素评估
- 市场环境变化风险:历史规律的有效性依赖当前市场结构与政策环境,若重大变化可能导致因子失效。
- 交易行为调整风险:市场参与主体的策略变更、交易行为演变均可能影响因子表现。
- 模型差异风险:不同量化模型体系和因子构建方法存在异见,结果不可绝对化。
- 因子稳定性风险:部分因子表现波动较大,特定时期风险增加。
报告明确提示投资者需结合市场实际谨慎应用,并动态调整策略应对不确定性。[page::0][page::1][page::17]
---
六、批判性视角与细微差别
- 负RankIC解读:报告多次出现因子RankIC均值为负,如买单方向成交比例因子RankIC均值为-9.2%或更低。负值表明因子与未来收益呈反向关系,投资实践中意味买一档成交比例较高的股票后续价格趋降,因此因子实际应用可能是逆向操作,即针对该因子数值低的股票持有。作者并未明确强调这一逆向使用细节,投资者须谨慎理解。
- 选股胜率偏低:部分因子选股胜率仅在22%-28%之间,表明因子选股能力不错但非强势信号,存在较多噪声和错误信号。
- 时段选择依赖性:因子有效性强烈依赖竞价时段,收盘竞价买单方向因子几乎无效,卖单方向因子选股效力有限且为负向信号,说明因子不均衡且敏感。
- 回测区间与市场周期限制:样本区间覆盖2019-2024年,跨度有限且囊括特定市场行情周期,横向推广需谨慎。
- 未涉及交易成本与容量限制:报告简单考虑交易费率,但未详细讨论成交量限制、滑点等实操问题,量化策略换仓频率可能对实际收益造成影响。
- 因子独立性声明基于相关系数较低,但未提供因子间因果关系分析,存在潜在重叠或共线风险。
---
七、结论性综合
本报告围绕A股集合竞价阶段的Level 2逐笔订单数据,科学构造15个因子,重点关注委托、成交和撤单的比例维度,系统回测其在深证A指成分股上的选股效果。实证结果表明:
- 集合竞价因子独立于传统大小单因子及Barra风格因子,能够为量化投资模型提供新的Alpha来源。
- 开盘集合竞价时段买单方向相关因子(如成交比例和撤单比例)表现突出,负向RankIC暗示逆向应用潜力,能够构建实现5%-10%以上超额年化收益的股票组合。
- 收盘集合竞价卖单方向成交比例因子表现同样优异,表明收盘时卖单强烈暗示个股未来看空,这是量化选股中较少关注的信号。
- 图表显示因子分档收益呈明显单调性,净值曲线优于基准证实了因子筛选的稳健性和实用性。
- 报告系统介绍了A股集合竞价市场结构和Level 1、Level 2数据的不同,解析了因子构建的理论依据和技术细节。
- 风险提示强调模型对市场结构变化高度敏感,投资者需结合实际审慎使用。
总体来看,该研究为量化投资提供了一个创新且实用的方向,即利用集合竞价阶段深度订单数据的细节特征,挖掘出反映市场微观行为与未来收益密切相关的选股因子。对于量化策略设计者及基金经理团队,该报告提供了重要的因子研究成果和实证支持,有助于拓展因子库,提升选股效率和策略回报。
---
八、附图示例
- 报告中的关键图表如“BuyTransactionBuyOrderratio09150920因子深证A指分档表现”如下:

- 体现了因子分档收益的单调递减,Q1(最高因子值组)收益明显优于Q50(最低因子值组)。
- 净值趋势图亦显示Top组合显著跑赢大盘:

---
综上,本次报告系统全面地分析了集合竞价相关因子,从数据源头、竞价规则、因子构建、回测性能及因子独立性等多个维度进行了详实论述,为后续量化模型的构建及优化提供了坚实的理论支撑和实证依据。[page::0][page::1][page::4][page::6][page::7][page::15][page::17]