`

选股因子系列研究(八十五)——买卖单主动成交中的隐藏信息

创建于 更新于

摘要

本文基于逐笔成交数据构建买卖单主动成交度因子,重点研究小单主动成交度的选股能力。实证显示小买单主动成交度因子具备显著正向选股能力,月均IC达0.05,年化超额收益约0.8%。引入该因子至中证500、1000指数增强组合,在不包含深度学习高频因子的基础模型下,能够带来0.5%-1.5%的年化超额收益提升。此外,因子在不同选股范围及调仓频率下均表现稳健,具有较强的稳健性和应用价值[page::0][page::5][page::6][page::14]。

速读内容


买卖单主动成交度因子构建及选股能力分析 [page::4][page::5][page::6]

  • 通过还原买单与卖单,基于成交额分布划分大单、中单、小单,分别统计其主动成交度。

- 小单主动成交度尤其是小买单主动成交度因子表现最优,月均IC 0.05,年化ICIR 2.00,月均多空收益1.78%,月均多头超额收益0.80%。
  • 小买单与小卖单主动成交度均为正向选股因子,组间收益单调且多空收益分布均匀。

- 不同时间段(全天、开盘后、盘中)计算的小单主动成交度均呈显著选股能力,盘中表现尤为突出。



小买单主动成交度因子年度及正交后表现 [page::7][page::8][page::9]

  • 小买单主动成交度因子2020年以来表现稳步增强,2022年表现尤为突出,多头超额收益稳定提升。

- 因子与多种传统因子相关性较低,独立选股能力显著,正交处理后依然保持较强截面选股能力。
  • 正交后因子月均IC仍维持0.03以上,月均多头超额收益仍保持正向,年化ICIR约2.4。

- 正交前后因子分年度多头超额收益趋势相近,显示因子稳定性和鲁棒性良好。





因子在不同股票范围及周度调仓下的表现 [page::9][page::10][page::11]


| 选股范围 | 全A | 沪深300内 | 中证800内 | 中证800外 |
|----------|-----|------------|-----------|-----------|
| 月均IC(正交前)全天小买单主动成交度 | 0.05 | 0.04 | 0.036 | 0.057 |
| 月均IC(正交后)全天小买单主动成交度 | 0.032 | 0.035 | 0.035 | 0.036 |
| 年化多头超额收益(正交前)全天小买单主动成交度 | 11.8% | 8.1% | 8.9% | 14.1% |
| 年化多头超额收益(正交后)全天小买单主动成交度 | 9.0% | 5.7% | 8.6% | 11.3% |
  • 因子在不同选股范围维持选股能力,且正交后不同范围间选股能力差距缩小。

- 周度调仓频率下,因子依然保持有效,且在不同选股空间周均IC较为接近,多头超额收益表现稳定。





小买单主动成交度因子在指数增强组合中的实践应用 [page::12][page::13][page::14]

  • 将小买单主动成交度因子加入中证500和中证1000指数增强组合测试,基础模型除去深度学习高频因子时,年化超额收益提升0.5%-1.5%不等。

- 参数设置中包括个股偏离度(0.5%、1%、2%)和行业中性或允许偏离(2%、4%)多种组合约束。
  • 加入该因子后各年度超额收益普遍提升,特别是2016、2017、2020、2021及2022年表现尤为优异。

- 含深度学习高频因子的基础模型则因子增量效果不稳定,效果边际递减明显。




风险提示及总结 [page::14]

  • 市场系统性风险、资产流动性风险及政策变动风险均可能对因子表现带来影响。

- 本文构建的买卖单主动成交度因子尤其小单主动成交度因子表现稳定,可以作为有效的量化选股因子,为投资组合收益提升提供增量alpha支持。

深度阅读

财务研究报告详尽分析报告



---

1. 元数据与概览


  • 报告标题: 《选股因子系列研究(八十五)——买卖单主动成交中的隐藏信息》

- 分析师: 冯佳睿、袁林青(海通证券研究所)
  • 发布日期: 2022年9月30日左右(具体日期未明确,但数据截止至2022年9月)

- 发布机构: 海通证券股份有限公司研究所
  • 主题: 主要聚焦股票买卖单数据中“主动成交度”因子的构建及其选股能力研究,进而测试该因子对指数增强组合的收益贡献。

- 核心论点:
- 买单与卖单不是简单的主动买入和主动卖出构成。
- 构建分类为大单、中单和小单的买卖单主动成交度因子,尤其是小单的主动成交度因子展示了显著的选股能力。
- 小买单主动成交度因子表现优于卖单,且在不同时间段(全天、开盘后、盘中)均有较强选股能力。
- 将该因子引入中证500和中证1000指数增强组合,能提升组合收益,尤其在不含深度学习高频因子的基础模型中表现更为显著。
  • 报告目标: 通过构建买卖单主动成交度因子,挖掘买卖单中的“隐藏信息”,提升基于订单簿数据的股票选股能力和量化组合表现。[page::0,4,14]


---

2. 逐节深度解读



2.1 买单与卖单的主动成交度(第1章)


  • 主要内容:

- 介绍买卖单还原方法,基于逐笔成交数据中的买单号、卖单号,结合成交量和成交价,区分买单与卖单中主动与被动成交金额。
- 举例说明2022年8月31日某股票的部分逐笔成交数据以及对应买单的主动与被动成交金额还原(详见表1和表2)。
- 强调买单(卖单)中的成交并非完全是主动交易,提出概念“主动成交度”,即买卖单中主动成交金额占比的度量。
- 分别定义大单、中单和小单的阈值(基于单日个股20日滚动均值及标准差),分别计算对应分组的买卖单主动成交度。
  • 推理依据:

- 逐笔成交数据固有“主动成交方向”并不足以完全反映买卖单主动性,需从买卖单视角更细粒度地刻画主动成交特征。
- 采用分单大小分类,可以对买卖行为进行更加精准的信号拆解。
  • 关键数据点: 买单示例中1067061的总成交金额24740元,其主动买入成交金额16081元,占比约65%;13821190买单的主动买入成交比例约78%。

- 方法说明:
- 定义主动成交度因子为大(中、小)买/卖单主动成交额与对应买/卖单成交额的比值。
- 各个阈值(大单、等)通过滚动统计确定,保证动态适应个股活跃度。
  • 意义:

- 为后续因子构建和选股能力研究打下坚实基础,逻辑更加统一且具备细化空间。[page::4,5]

2.2 主动成交度因子的选股能力(第2章)


  • 核心论点:

- 综合考察大单、中单、小单主动成交度因子的月度选股能力,发现小单主动成交度因子表现最为突出,且买单强于卖单。
  • 关键数据点(表3):

- 小买单主动成交度月均IC为0.05,年化ICIR高达2.00,月度胜率74%,月度多空收益1.78%,多头超额收益0.80%。
- 大买单主动成交度反向,表现不佳,月均IC为-0.004,说明大单的主动成交度未必与未来股票表现正相关。
  • 图1分析:

- 因子分组收益图显示,小买单主动成交度的组间收益呈现单调上升,表现最为显著且稳定,其他组因子表现平平或负收益。
  • 讨论小单主动成交度因子的进一步分析(表4):

- 小买单全天和盘中主动成交度选股能力最好,超额主动成交度(即与大单主动成交度的差值)对小卖单表现更优。
- 多时间段数据表明,盘中小买单主动成交度的IC达0.053,胜率75%,月均多空收益1.84%。
  • 图2、图3展示:

- 分年度多头超额收益呈现稳健提升,2014年表现偏弱,2020年至2022年明显增强。
- 多头超额净值曲线反映因子收益累积效应,表现出持续增长趋势。
  • 因子与传统因子相关性(表5):

- 小买单主动成交度与换手率负相关,与大单及买入意愿正相关,说明因子捕捉的是不同维度的信息。
  • 正交调整后的表现(表6及图4-5):

- 因子被正交处理(剔除行业、市值、换手率、反转等因子影响)后,仍保持显著的选股能力,年化ICIR部分上升,多头超额收益略下降但依然稳健。
  • 选股范围差异(图6-9):

- 原始因子在中证800外(更小市值或更广泛市场)表现更强,正交后差距缩小,表明因子更适合覆盖更广泛的市场范围。
  • 净值走势(图10-13)和周度调仓能力(图14-21):

- 正交前后均在1-4月及8月中旬后呈现明显多头效应,显示因子对短期以及周度频率的股票选择亦有效。
- 在周度调仓测试中(图14-17),同样观察到中证800外表现更好,说明因子具有一定灵活性和高频应用潜力。
  • 总结此章节:

- 小单尤其是小买单主动成交度因子稳定、高效地捕捉买方主动行为的市场信号,蕴含实际投资价值。[page::5-11]

2.3 指数增强组合添加测试(第3章)


  • 背景说明:

- 紧跟量化投资趋势,验证小买单主动成交度因子是否能进一步提升市场上主流增强组合模型表现。
  • 基础模型和约束说明:

- 基础模型包含多种传统因子(市值、估值、换手、波动、反转、盈利、SUE)、买入意愿、大单净买入和深度学习类高频因子等。
- 衡量不同约束条件下的个股偏离、行业中性及换手率限制,模拟实际操盘环境。
  • 核心测试结果(表7、表9):

- 当基础模型不包含深度学习高频因子时,将小买单主动成交度加入模型,可显著提高组合的年化超额收益,幅度约0.5%~1.5%(中证500),0.5%~2.0%(中证1000)。
- 超额收益提升在弱约束(较大个股偏离和行业偏离)的条件下更加明显。
  • 当基础模型包含深度学习高频因子时(表8、表10):

- 小买单主动成交度因子的增益表现降低或不稳定,可能因深度学习高频因子已捕获部分主动成交度信息。
  • 图22、图23中年度表现分析:

- 因子加入使得大部分年份组合超额收益得到增强,特别是2016、2017、2020及2021年,说明因子在不同市场环境均有应用价值。
  • 组合优化方法简述:

- 使用因子收益回归法估计因子溢价,结合未来12个月的因子溢价均值预测。
- 优化目标为最大化组合预期超额收益,权重调整受到多重约束限制,包括行业中性、估值和换手率等。
  • 意义:

- 该结果验证了买卖单主动成交度因子的实际应用价值,为量化投资体系补充了新型高频因子来源。[page::11-14]

2.4 总结与风险提示(第4、5章)


  • 总结核心观点:

- 买卖单主动成交度因子尤其是小买单类别,具有显著稳定的选股能力。
- 在不含深度学习因子的指数增强模型中,该因子可以带来约0.5%~1.5%的年化超额收益提升。
- 该因子逻辑清晰、具有较强普适性,适合多频率及多股票池应用。
  • 风险提示:

- 市场系统性风险、资产流动性风险和政策调整风险均可能影响策略表现。
- 投资者需关注宏观及监管环境变动带来的潜在影响。
  • 总体评价:

- 报告提供了细粒度的订单簿数据因子创新路径,并辅以严谨的实证分析,结论可信,应用价值较高。[page::14]

---

3. 图表深度解读



3.1 表1与表2(买卖单还原示例)


  • 展示了某股票在2022年8月31日部分逐笔成交数据和对应的买单还原结果,具体区分主动买入与被动买入,展示了买单金额的详细组成。

- 表明买单和卖单中非全部成交为主动,强调分解分析主动成交必要性。[page::4]

3.2 表3(买卖单主动成交度因子月度选股能力)


  • 列出六类因子(月均IC、胜率、收益等),显示小买单主动成交度IC最高0.050,表现显著且稳定。

- 大买单主动成交度反向,暗示大单主动成交度不具备预测能力。
  • 数字突出小单(特别是小买单)对选股重要性。[page::5]


3.3 图1(买卖单主动成交度因子分组收益)


  • 六条线分别代表大买单、中买单、小买单及对应卖单主动成交度,横轴为分组,纵轴为收益。

- 小买单主动成交度曲线明显单调向上,表明多头收益稳定提升,其他均表现平缓或负向。
  • 视觉直观支持表3结论。[page::6]


3.4 表4(小单主动成交度因子月度选股能力)


  • 细化小单因子按全天、盘中、开盘后及超额主动成交度表现。

- 盘中小买单主动成交度IC最高(0.053),表现稍优全天。
  • 超额主动成交度对卖单略有利,但买单优势明显。

- 显示不同时间段信息价值差异。[page::6]

3.5 图2与图3(小买单主动成交度分年度收益与净值)


  • 图2呈现因子多年表现趋势,近年尤其在2020后表现持续提升。

- 图3多头超额净值走势平稳上升,直观展示因子收益积累。
  • 辅助凸显小买单主动成交度因子稳定性与成长性。[page::7]


3.6 表5(因子与常规因子截面相关性)


  • 相关性均不高,换手率负相关明显,说明主动成交度捕捉的是不同于传统高频指标的信息。

- 支持因子独立性,有利于模型增益。
  • 分析具体显示换手率与因子逆相关,或暗示因子更倾向于细分市场的主动交易行为。[page::7]


3.7 表6与图4-5(正交后因子表现)


  • 表6显示正交处理后因子仍具显著IC和超额收益,努力剔除被其他因子解释的信息,提高因子纯度。

- 图4、图5反映年度以及净值走势与正交前相似,稳健。
  • 证明主动成交度因子具有独立的信息价值,非表面“换手”等简单指标替代。[page::8-9]


3.8 图6-9(因子选股能力不同股票范围对比)


  • 图6、7显示正交前因子在中证800外显著优于内;正交后差异缩小。

- 图8、9对应的年化多头超额收益同样显示中证800外收益更高,正交后差距减缓。
  • 表明该因子对小盘股或中证800外股票更敏感,选股能力更强。

- 区分市场结构下因子信号的活跃度和收益表现的差异。[page::9]

3.9 图10-13(因子多头超额净值走势)


  • 展示2022年因子净值走势,正交前后均在1-4月和8月中旬后呈现明显多头效应。

- 中证800内正交因子表现优于整体,暗示中盘股利用正交因子可能受益最大。
  • 净值曲线均表现平稳上升,符合稳定选股信号要求。[page::10]


3.10 图14-17(周度选股能力)


  • 与月度分析类似,显示因子在周度调仓频率下依然发挥选股能力,多数情况下中证800外表现更佳。

- 周度调仓体现因子适合用于中高频量化投资,灵活性好。[page::10-11]

3.11 图18-21(周度多头超额净值)


  • 净值走势一致稳定上升,正交前后无大差异,说明因子在不同频率下均能良性发挥。

- 不同板块走势略有差异,体现因子异质化收益特点。[page::11]

3.12 表7-10与图22-23(指数增强组合测试)


  • 表7、9显示小买单主动成交度对中证500和中证1000增强组合未含深度学习因子时,均有明显收益提升(0.5%-2.0%不等)。

- 表8、10显示包含深度学习高频因子时,因子增益不明显或波动,反映信息冗余。
  • 图22、23呈现年度收益对比,因子加入后表现更优,尤其是在个别年份表现突出。

- 以上数据充分体现了该因子的实务应用潜力及行业验证。[page::12-14]

---

4. 估值分析



本报告主要侧重于因子构建与选股能力验证,未涉及传统意义上的企业估值分析(如DCF或市盈率估值等)。

唯一相关的是指数增强组合优化的权重分配,优化目标为最大化因子加权预测收益,采用线性回归法预测因子溢价,风险控制约束涵盖个股偏离、因子敞口、中行业偏离和换手限制。

因此,因子“估值”体现为其边际贡献的超额收益提升,而非对企业估值的衡量。

---

5. 风险因素评估



报告明确意识到以下主要风险:
  • 市场系统性风险: 宏观经济变化、市场波动均可能直接影响因子表现及组合收益。

- 资产流动性风险: 主动成交度因子依赖流动性活跃的细分买卖单数据,流动性稀缺时可能导致因子信号失效。
  • 政策变动风险: 行业政策或监管环境的调整可能影响市场行为模式,从而影响因子稳定性。

- 因子模型风险: 含深度学习等高频因子的基础模型复杂度高,因子贡献可能随模型参数和特定环境调整出现波动。

报告未细化具体风险的发生概率与应对策略,但强调用户需结合上述风险审慎使用该策略。[page::0,14]

---

6. 批判性视角与细微差别


  • 因子收益的稳定性: 虽然总体表现良好,但2014年及部分年份选股能力较弱,显示因子并非周期内稳定有效,需结合宏观及市场风格调整。

- 深度学习因子覆盖风险: 深度学习高频因子与买单主动成交度因子存在信号重合,可能导致因子边际增益受限,说明该因子在某些高维度模型下存在替代性。
  • 市场覆盖范围差异: 因子在中证800外表现显著优于内,暗示因子更适合中小盘市场,但在中证800范围内收益被正交处理后接近均衡,需投资者根据目标市场灵活使用。

- 策略实施难度: 由于依赖逐笔成交数据细粒度还原买单卖单以及主动成分,数据处理和计算复杂度较高,实际应用时需保证数据质量与处理效率。
  • 回测期间限制: 数据主要覆盖2014年至2022年,后期市场结构和交易制度变动可能影响因子未来有效性,需持续动态调整。

- 风险提示较为笼统,未有定量风险控制建议或冲击测试,后续研究可提升风险管理深度。[page::6-8,14]

---

7. 结论性综合



本文报告通过深度挖掘逐笔成交数据中的买卖单信息,首次系统定义并测算了买单和卖单的主动成交度,且细分成交额大小(大单、中单、小单)构建了多维因子体系。

实证结果发现:
  • 小单主动成交度因子表现最优,尤其是小买单主动成交度,月均IC达到0.05,年化ICIR约为2.0,展现出高度稳定的截面选股能力。收益表现月度多空收益可达1.78%,多头超额收益0.80%,且组间收益单调性强,风险分布均衡。

- 因子不同时间段数据的选股能力均显著,盘中的表现略优全天。
  • 经过行业、市值、换手等因子正交处理,因子仍保持空间截面预测力,表明独立信息价值。

- 因子在较小市值或中证800外股票池中表现更佳,对中小盘市场具有较大潜力。
  • 因子不仅对月度选股有效,对周度调仓也保持较好适用性,适合高频量化投资框架。

- 在实盘增强组合测试上,小买单主动成交度因子在含传统因子组合提升年化超额收益0.5%-2%,但在含深度学习因子的高频组合中,这种增益减弱。
  • 报告以严谨的数据和多维度的模型测试展示了买卖单主动成交度因子的实际投资价值,同时提醒了市场风险和执行风险。


综上,该项研究突破了传统逐笔成交信息的解读,提出买卖单主动成交度的新概念,具备较强的学术价值与实务参考意义。其细颗粒度的因子构建方法和系统性验证框架为未来高频因子研究和量化投资策略改进提供了有力工具和范例。

---

图表索引用Markdown格式展示重要图表示例:


  • 图1 买卖单主动成交度因子分组收益(2014-2022.09)


  • 图2 小买单主动成交度因子分年度多头超额收益(2014-2022.09)


  • 图4 小买单主动成交度因子分年度多头超额收益(正交后,2014-2022.09)


  • 图22 因子加入前后,中证500指数增强组合分年度超额收益(不含深度学习高频因子)


  • 图23 因子加入前后,中证1000指数增强组合分年度超额收益(不含深度学习高频因子)



---

参考文献与溯源



本文分析内容严格基于海通证券《选股因子系列研究(八十五)——买卖单主动成交中的隐藏信息》,引用页码如下:
  • 0至5页:研究背景介绍、买卖单还原方法、主动成交度定义。

- 5至11页:主动成交度因子的构建细节与选股能力分析,图表解读。
  • 11至14页:指数增强组合实证测试及收益分析。

- 14页后续:总结与风险提示,合规与声明等。

具体页码标注请参见相应段落处[page::x]

---

总结



该报告通过细微数据处理和严谨回测,证明了买卖单主动成交度(尤其是小买单)因子的强大信息价值,及其在量化增强组合中实用性。虽然面临深度学习因子的覆盖和市场风险等挑战,该因子依然为证券投资研究者和实操投资机构提供了具备增量收益潜力的新选股工具。

以上为对《选股因子系列研究(八十五)——买卖单主动成交中的隐藏信息》报告的极为详尽、系统、专业的分析解构。若需更细节讨论,欢迎继续询问。

报告