`

选股因子系列研究(八十五)——买卖单主动成交中的隐藏信息

创建于 更新于

摘要

本报告基于买卖单逐笔成交数据,定义了买单与卖单的主动成交度因子,重点构建并测试了小单主动成交度因子的选股能力。研究发现,小单主动成交度因子表现出显著的正向月度和周度选股能力,且小买单主动成交度较小卖单更优。因子在不同选股空间中均具有效果,尤其在中证800外表现更为突出。将该因子引入不含深度学习高频因子的中证500和中证1000指数增强组合中,可提升年化超额收益约0.5%-1.5%。报告还分析了因子的正交特性与风险提示,对量化组合优化具有重要参考价值[page::0][page::4][page::6][page::14]。

速读内容

  • 报告核心观点及投资要点总结[page::0][page::4]:

- 买卖单主动成交并非完全由主动买入或卖出构成,基于大单、中单、小单分类,构建对应的主动成交度因子。
- 小单主动成交度因子的月度选股能力明显优于大单、中单,小买单主动成交度因子月均IC约0.05,多空收益分布均匀,月度多空收益率达1.78%,多头超额收益达0.80%。
- 小买单主动成交度因子在全天和盘中时段均具备显著的选股能力,盘中表现略优。小卖单超额主动成交度优于小卖单主动成交度。
- 因子正交处理后仍保持显著选股能力,尽管多空收益有所下降但分布均匀,且不同选股范围的效力差异减小。
  • 小买单主动成交度因子选股能力数据展现及趋势[page::6][page::7][page::8][page::9]:





- 因子在2014-2022年总体呈现上升趋势,2020年后表现尤为突出,多头超额净值稳健上涨。
- 因子与典型因子相关性较低,部分与换手率、买入意愿及大单因子正相关。
- 正交化后多头超额收益略低,但因子独立性增强且稳健性提升。
  • 因子在不同选股范围内表现及周度选股能力[page::9][page::10][page::11]:







- 原始因子在中证800外选股能力明显优于中证800内,但正交后差异缩小,显示因子效果具普适性。
- 因子周度选股能力类似,周均IC在各范围内较为均衡,且多头超额收益在中证800外依然表现更优。
- 多头超额净值曲线显示因子在2022年主要月份表现稳定并有显著多头效应。
  • 指数增强组合实证测试[page::12][page::13][page::14]:



- 在中证500增强组合中,加入小买单主动成交度因子(不含深度学习高频因子)使年化超额收益提升0.5%-1.5%。
- 加入因子后,超额收益在多数年份均有所增强,表现稳定。
- 当基础模型包含深度学习高频因子时,该因子的收益提升效果不稳定,依赖具体风控参数。
- 中证1000增强组合测试结果与中证500类似。
  • 因子构建与优势总结[page::4][page::14]:

- 以买卖单的主动成交度为核心,结合大单、中单、小单的阈值划分,统一计算并构建因子。
- 在月度及周度频率下,因子展现出持续稳定的选股能力。
- 有助于改善传统多因子模型中未覆盖的微观交易行为信息,提升投资组合收益。
  • 风险提示[page::0][page::14]:

- 市场系统性风险、资产流动性风险与政策变动可能影响因子及策略表现。

深度阅读

详细分析报告:《选股因子系列研究(八十五)——买卖单主动成交中的隐藏信息》



---

1. 元数据与概览


  • 报告标题: 选股因子系列研究(八十五)——买卖单主动成交中的隐藏信息

- 分析师: 冯佳睿,袁林青
  • 发布机构: 海通证券研究所

- 发布日期: 未明确标注具体日期,资料截止至2022年9月
  • 研究主题: 基于买卖单的主动成交度因子构建及其在选股中的应用,重点研究买单与卖单主动成交度因子尤其是小单在股票超额收益预测中的作用


核心论点总结:

本报告围绕逐笔成交数据中买单与卖单的主动成交成分,提出了一种以主动成交度刻画买卖单特征的选股因子,重点强调小单主动成交度在月度和周度选股中的良好表现。研究发现,小单主动成交度因子显示出较强的正向选股能力,其中小买单的表现优于小卖单。此外,将小买单主动成交度因子纳入中证500和中证1000指数增强组合,能够为未包含深度学习高频因子的基础模型带来0.5%-1.5%的年化超额收益提升,但对包含深度学习因子的模型提升效果不稳定。报告同时警示市场系统性风险、流动性风险和政策风险。

---

2. 逐节深度解读



2.1 研究背景与因子构建逻辑


  • 买卖单还原与主动成交度定义: 研究团队基于逐笔成交数据中的买单号和卖单号,成功还原了买卖单完整构成,进一步将每个买卖单拆分为主动成交和被动成交部分。该方法解决了传统逐笔成交数据中买卖方向未必完全对应主动买入和卖出的问题(尤其是在非集合竞价时段)[page::0,4]。

- 主动成交度因子计算方法:
- 对成交额分布按单笔金额大小划分为大单(>均值+1倍标准差)、中单(均值到均值+1倍标准差之间)和小单(<均值),其中均值和标准差基于个股20日滚动计算。
- 对大/中/小单分别计算主动成交度,即主动成交金额占该类单成交总额的比例。例如,小买单主动成交度为小买单主动成交金额除以小买单成交金额。
- 利用多日滚动均值计算因子稳定性[page::4-5]。
  • 优势: 用买卖单视角统一因子构建逻辑,除了整体主动成交度,还针对不同单额范围分别建立因子,挖掘更多选股信息[page::5]。


2.2 主动成交度因子的选股能力


  • 月度选股能力(表3):

- 大单和中单主动成交度未表现出显著的月度选股能力。
- 小单主动成交度呈现突出选股能力,且小买单主动成交度优于小卖单,月均信息系数(IC)为0.05。因子收益单调,月度多空收益约1.78%,月均多头超额收益0.80%[page::6]。
  • 图1解析(买卖单主动成交度分组收益): 图表显示小买单主动成交度最高的分组收益领先,且多头收益较为稳定,而大买单/中买单表现较为平缓甚至呈现负收益注意事项,说明小单的主动成交度与未来超额收益的正相关性显著[page::6]。

- 小单主动成交度细分分析(表4): 研究进一步通过不同时间段(开盘9:30-10:00,盘中10:00-15:00)计算小单主动成交度,发现盘中小买单主动成交度选股能力更显著,同时小卖单超额主动成交度(小单主动成交度减去大单主动成交度)优于对应主动成交度。小买单超额主动成交度未见明显提升[page::6]。
  • 图2 & 图3:

- 图2显示小买单主动成交度因子多头超额收益分年度表现,2014、2018、2019年较弱,2020年以来表现增强尤其是2022年波动后回升。
- 图3的累计净值表现确认因子具有较好的盈利累积能力,2022年持续向好[page::7]。

2.3 因子独立性及正交处理影响


  • 因子相关性(表5):

- 小买单主动成交度与主流因子相关性低,与换手率负相关、与买入意愿及大单因子正相关,显示该因子可补充传统因子解释力[page::7]。
  • 正交处理后选股能力(表6):

- 因子经过行业、市值、换手、反转等四个因子的正交处理后,仍保持稳定截面选股能力,月度多空收益略有下降但分布均匀。[page::8]
  • 图4 & 图5: 正交后因子年化多头超额收益依旧稳健,且近年表现依然突出,与正交前走势大致一致,说明因子不完全被其他主流因子所替代[page::8-9]。


2.4 因子在不同股票池的表现差异


  • IC与超额收益对比(图6-9):

- 原始因子在中证800指数以外(主要为中小市值股票)表现更优,月均IC和年化多头超额收益均在外部股票明显更好。
- 经正交处理后,因子在中证800内外的表现差距缩小,表明因子在大中型股票池的独立有效性得到提升。
  • 多头超额净值(图10-13):

- 2022年以来,无论正交前后,小买单主动成交度均在不同股票池表现出明显的多头超额净值增长,正交后中证800内表现尤为突出[page::9-10]。

2.5 因子周度选股能力分析


  • 周度层面,因子同样展现正向选股能力,原始因子在中证800外的IC更高,正交后不同股票池周均IC趋于一致。

- 多头超额收益也表现类似,因子在中证800外表现更优,且正交处理后这种差异仍存在。
  • 近年(2022年)周度选股表现稳定,在1-4月及8月中旬之后表现尤为突出[page::10-11]。


2.6 指数增强组合测试


  • 模型设定: 采用多因子回归法预测个股收益,构建中证500和中证1000指数增强组合,加入风险控制(个股偏离、行业偏离、因子敞口、换手率约束),假设成交价为次日均价并计3‰交易成本[page::12]。

- 中证500增强组合测试(表7-8 和图22):
- 不含深度学习高频因子的基础模型中引入小买单主动成交度因子,年化超额收益提升0.5%-1.5%。
- 包含深度学习因子的模型中,该因子对超额收益提升不稳定。
- 图22显示,除部分年份外,因子引入后绝大多数年份组合表现提升明显。
  • 中证1000增强组合测试(表9-10 和图23): 与中证500类似,因子加入带来微幅收益提升,但包含深度学习因子时表现不稳定。2022年组合收益提升明显[page::13-14]。


---

3. 图表深度解读



本报告包含大量图表和表格,以下为其中重要图表的详细解读:
  • 图1(买卖单主动成交度分组收益)[page::6]:

- 描述不同大小买单的主动成交度分组对应的股票超额收益表现。
- 小买单主动成交度分组呈现收益显著的线性正相关趋势,最高组收益率明显领先,反映该因子具有很好的收益预测能力。
  • 图2、图3(小买单主动成交度年度多头超额收益与净值)[page::7]:

- 图2展示多头超额收益在不同年份的波动趋势,表现出因子收益近年来稳步增长的良好趋势,尤其2022年表现突出。
- 图3净值图进一步说明因子累积策略的正效应,净值呈上升趋势,说明投资者基于该因子构建的策略有较好的累积收益能力。
  • 表4(小单主动成交度月度选股能力)和图4、图5(正交后因子表现)[page::8-9]:

- 表4显示不同时段小单因子的IC和超额收益,盘中小买单表现最好。
- 正交后(剔除与市值、换手、行业等因子相关部分),因子表现仍然稳健,表明因子具备独立信息量。
  • 图6至图9(不同股票池因子IC与超额收益对比)[page::9]:

- 体现因子在不同股票池的表现差异,尤其小盘股池外更突出。正交后因子表现趋于平衡,暗示因子在大中型股票池也有用武之地。
  • 图10至图13(不同股票池多头净值线)[page::10]:

- 附图显示无论正交与否,小买单主动成交度因子均持续带来累积超额收益,熨平了不同股票池的收益差异。
  • 图14至图17(周度选股的IC与年化超额收益)[page::10-11]: 因子同样体现良好的周度选股能力,且不同股票池表现延续月度特征。

- 图22与图23(指数增强组合超额收益对比)[page::13-14]:
- 加入因子后,组合超额收益呈现可观提升,表现出该因子的实际应用价值。

---

4. 估值分析



本报告主要聚焦于选股因子的构建及其评估,未涉及公司层面的传统估值分析方法,如DCF、市盈率等。其增值点在于通过因子收益模型及指数增强组合性能测试,验证主动成交度因子带来的收益增强作用。

---

5. 风险因素评估



报告明确指出以下风险:
  • 市场系统性风险: 宏观经济波动、金融市场整体下行可能影响策略有效性。

- 资产流动性风险: 流动性不足可能导致策略执行成本增加或收益受限。
  • 政策变动风险: 相关政策调整可能带来市场结构性变化,影响因子效用[page::0,14]。


报告未具体详细披露风险缓释措施,但其因子在多个市场与时段验证相对稳定,或在一定程度降低偶发风险。

---

6. 批判性视角与细微差别


  • 因子表现依赖基础模型配置: 当基础模型包含深度学习高频因子时,小买单主动成交度因子的增量收益不稳定,提示其可能与部分深度学习因子存在信息重叠或互补性不足。说明该因子在高度复杂模型中边际贡献存在不确定性。

- 大单、中单主动成交度无显著选股能力: 该事实提出了市场中大单成交可能被更复杂因素驱动,简单的主动成交度难以捕获其选股信息。研究或可进一步结合委托单簿结构、成交意图建模。
  • 仅基于过往数据回测结果: 尽管样本时长较长(2014-2022),未来市场结构、交易行为变化可能使因子表现产生偏移。

- 计算方法细节较少: 尽管大致说明滚动均值和阈值划分,具体参数设置和异常值处理等未详述,可能影响因子稳健性。

---

7. 结论性综合



本报告围绕买卖单的主动成交度从微观交易数据切入,提出了创新的选股因子构建思路,重点阐释了小单主动成交度尤其是小买单主动成交度因子的强大选股能力。基于2014年至2022年9月丰富的历史数据验证,小单主动成交度具备稳定的月度和周度正向选股能力,月均IC约0.05,月均多头超额收益达0.8%。相比大单和中单,小单因子信息量更充足,且盘中时段表现更佳。

因子的独立性经过与多个传统因子的正交测试验证,证实其为有效补充选股信号。其在不同股票范围(如中证800内外)均表现有效,虽然在中小市值股票中表现更佳,正交后大中型股票中也有所展现。纳入中证500与中证1000增强组合时,该因子为不含深度学习高频因子的模型带来0.5%-1.5%的年化超额收益提升,具备实际应用价值。

报告基于详实的实证测试和丰富图表论证,结合交易行为微观数据找寻选股Alpha,体现了量化投资因子研究的深度与创新性。整个分析逻辑清晰,结果稳健,但仍需关注风险因素和未来因子表现的动态变化。

综合来看,报告结论鲜明:买卖单中的小单主动成交度是一个值得关注和应用的选股因子。其在量化投资实践中具有较高潜在价值,同时为市场微观结构研究开辟了新思路。

---

参考图表示例



图1 买卖单主动成交度因子分组收益(2014-2022.09)


图2 小买单主动成交度因子分年度多头超额收益(2014-2022.09)


图22 因子加入前后,中证500指数增强组合分年度超额收益(不包含深度学习高频因子)


---

溯源


以上内容及数据均来源于《选股因子系列研究(八十五)——买卖单主动成交中的隐藏信息》报告中的各章节与附图表说明 [page::0,4–14]。

报告