`

海通金工 | 什么类型的交易更具市场影响? 大单因子的研究与改进

创建于 更新于

摘要

本报告基于KMedian聚类算法划分成交订单类型,深入分析大单因子细分后不同类别成交金额及主动买卖特征对选股效果的影响,揭示大单净买入因子有效性主要依赖中买大卖、小买大卖等部分且因子表现近年有所衰减。通过引入基于大单短期绩效的因子改进方法,有效缓解了因子衰减趋势,提升了指数增强组合收益表现,为量化投资因子构建提供新的视角和改进路径 [page::0][page::1][page::2][page::4][page::5][page::6][page::7][page::8][page::9]

速读内容


订单类型划分与因子细分 [page::1]


  • 采用KMedian聚类算法对订单成交金额分为小单、中单、大单三类,替代传统均值+标准差划分,提升了订单类型界定的准确性。

- 成交类别合并买卖双方类型,共形成9种成交类型,为后续因子构建奠定基础。

成交占比因子表现与解读 [page::2][page::3]


| 成交类型 | IC | IR | 多空收益 | 多空胜率 |
|----------|------|-------|-----------|----------|
| 大买大卖 | 0.019 | 2.848 | 0.34% | 64.7% |
| 中买大卖 | -0.028 | -5.206 | -0.54% | 27.5% |
| 小买大卖 | -0.015 | -2.251 | -0.24% | 39.0% |
| 大单净买入 | 0.032 | 6.381 | 0.59% | 76.8% |
  • 大单净买入因子选股主要依赖小买大卖与中买大卖,说明因子有效性不在大资金买入而在大额筹码向中小资金卖出的行为。

- 大买大卖因子存在稳定的正向选股能力,而中买大卖、小买大卖体现负向特征,表明因子成分内含不同信号属性。

主动买卖维度细分分析 [page::3][page::4][page::5]


  • 主动买入的“大买大卖”因子因子表现更为稳健,IC保持在0.02-0.04区间震荡,衰减较低,是持续有效的选股因子。

- 主动买卖分解显示,大买中卖和大买小卖因子表现不及主动买入的大买大卖,主动卖出对整体衰减存在拖累。
  • 中|小买大卖因子主动买入及卖出均衰减明显,特别是2022年后IC反转,表现大幅萎缩。


因子衰减与改进方案 [page::4][page::5][page::6][page::7]


  • 识别市场机构算法交易兴起导致大单特征减弱,传统基于成交金额大单因子表现衰退。

- 依据短期绩效剔除无效大单,提升因子纯净度,改进后的因子IC在近年得到一定恢复,尤其主动买入部分表现明显改善。
  • 复合改进后,主动买入的大买大卖、中买大卖、和小买大卖因子效果均有提升,因子表现提升更为显著于最近几年。


因子增强组合实证及表现 [page::8]


  • 构建基于中证500和中证1000的指数增强组合,加入原始及改进后大单因子。

- 加入改进后因子的组合在年化超额收益上较不加入因子组合有约1%的提升,特别是在近3年有效修正了因子衰减带来的组合表现下滑。
  • 组合风险指标保持稳定,说明因子改进同时兼顾收益与风险。


结论与未来思考 [page::9]

  • 大单因子因市场结构变化出现选股效果逐步衰减,需要结合底层市场结构和算法交易特征进行因子改造。

- 简单基于同类量价数据构建因子难以根本突破风险因子局限,应关注风格化特征的深层利用。
  • 后续研究应致力于挖掘更具信息含量的量价数据特征,提升因子持续有效性。

深度阅读

海通金工:《什么类型的交易更具市场影响?大单因子的研究与改进》详尽分析报告



---

一、元数据与报告概览


  • 报告标题:《什么类型的交易更具市场影响?大单因子的研究与改进》

- 作者:郑雅斌,海通金融工程首席分析师
  • 发布机构:海通证券研究所

- 发布日期:2024年9月6日(微信推送),正式报告发布时间为2024年8月27日
  • 报告主题:基于高频交易数据,深入探讨大单因子的类型划分、表现、衰减及改进方法,重点分析不同类型成交对股票短期走势和选股效果的市场影响。


核心论点与主要信息

报告通过区分小单、中单、大单成交额,使用KMedian聚类替代传统的均值加N倍标准差方法,构建细粒度的订单类型划分,分析不同类别的成交(买卖双方类别)对股票后续表现的影响。发现:
  • 大单净买入因子的选股有效性主要来自于中买大卖与小买大卖部分,而非源于大买单的买入行为;

- 主动买入的大买大卖因子表现更稳定,因子衰减较小;
  • 综合考虑大单成交后的短期股票走势,基于大单短期绩效能改进因子表现,减少因子衰减;

- 该改进使得大单因子在近年选股效能有所恢复,但整体因子表现仍难回到早期高峰;
  • 研究结果对构建更有效的量价因子提供了方法论参考及实践指导。


---

二、逐节深度解读



2.1 订单类型界定与成交类别划分



关键内容总结



传统大单因子基于成交金额均值加N倍标准差设阈值划分“大单”,但由于订单金额分布呈左厚尾(长尾)特征,均值和标准差难以精准区分小额订单,导致类型划分粗糙。为改进,报告引入KMedian聚类算法对N日内订单成交金额(自然对数)进行聚类,划分为三类:小单、中单、大单。
  • 阈值定义方法

- 小单阈值来自最小类别成交额最大值和次大类别成交额最小值的均值;
- 大单阈值对应次大与最大类的边界均值;
  • 每一笔订单成交额自然对数落在对应区间即被划分为小、中、大单;

- 由买卖双方的单子大小组合,可将成交归入九种类型(小买小卖、小买中卖、小买大卖等)(见图1)[page::1]。

逻辑与意义


  • KMedian聚类更适应偏态分布,能细分出更多层次的订单类型;

- 细粒度划分为后续分析不同类型成交对股票影响提供基础,有助于挖掘隐含的市场行为特征。

---

2.2 各类成交占比因子表现



关键论点与数据


  • 采用开盘半小时各类成交金额占比构建因子,考察其风险调整信息系数(IC)、信息比率(ICIR)、多空收益及胜率(见表1)。

- 初步发现:
- 只有中买大卖因子IC约-0.03(IR超过-5)表现明显,且多头收益为负(因因子为负向选股因子),表明该类成交与股价负相关且具有选股价值;
- 放宽观察后,大买大卖、小买大卖及中买中卖也有一定的选股表现;
- 各因子的绝对IC值ABS
IC均较大,说明它们带有显著风险因子性质。

推论


  • 大单净买入因子实际由小买大卖、中买大卖主导选股效果,意味着因子有效性不是大资金买入行为带来的,而是大额筹码向市场中小资金卖出筹码的过程起到了驱动作用。

- 大买大卖本身也有正向选股能力,主要源于大买大卖组合对因子贡献。

---

2.3 买卖主动成交划分与因子表现


  • 进一步基于主动买入/主动卖出对上文成交类型拆分;

- 观察主动买入大买大卖因子表现远超其主动卖出部分,并且因子的选股效果更显著(表3及后续论述);
  • 但是整体大单净买入因子的构成中主动成交因素对最终选股效果影响有限;

- 主动买入大买大卖因子的IC持续稳定在0.02-0.04之间,表现为有效选股因子;
  • 主动卖出的部分对因子表现构成一定拖累,导致整体大单因子表现不如分离后因子(图3)[page::3][page::4][page::5]。


---

2.4 成交占比因子表现的时序衰减


  • 通过52周滑动窗口,观察2017年至2024年期间各类成交占比因子IC表现趋势(图2~图6);

- 发现大买大卖、中|小买大卖及大单净买入因子均表现出明显衰减,尤其从2021年起衰减加速;
  • 主动买入大买大卖因子衰减幅度较小,仍保持较为稳定选股能力;

- 大买中|小卖因子及其主动买卖切分展示持续负选股能力,表现为风险因子;
  • 该阶段市场结构变化(算法交易普及,机构交易订单分散)是因子衰减的主要背景逻辑[page::4][page::5]。


---

2.5 基于短期绩效的大单因子改进


  • 提出大单最后一笔成交后30秒内股价相较市场表现的短期绩效检验理念:

- 若买单后股价相对市场下跌,或卖单后价格相对上涨,则该大单被认为无效;
- 在计算因子时剔除无效大单,提升因子纯净度;
  • 改进后,2017年起大单因子IC显著提升,尤其是主动卖出大买大卖因子表现获得较大加强(详见表4);

- 主动买入部分因子表现提升有限,主动卖出部分改进更明显;
  • 综合复合改进后(保留表现较好的主动买入与主动卖出部分复合),因子表现进一步优化(表5和表6),且2021年以后的提升更明显,虽然还未回到2016年之前的高峰,但延缓了选股有效性衰减趋势[page::5][page::6][page::7]。


---

2.6 不同成交占比因子的组合增强表现


  • 将成交占比因子不叠加与加入不同改进版本因子分别用于构建中证500和中证1000增强组合,考察表现差异。

- 组合构建控制市值、市盈率、市场暴露,多因子交叉验证。
  • 从累计净值、年度超额收益图(图7~图10)及表7数据看:

- 加入大单净买入因子及改进后的大买大卖、中|小买大卖因子均能显著提升组合超额收益;
- 改进后的因子对近几年尤其是近一年的收益提升作用更加显著,恢复了因子在近3年衰减带来的组合收益拖累;
- 信息比率(IR)和最大回撤数据均显示了改进因子组合在稳健性和收益风险比率上的提升;
  • 说明改进策略不仅提升了单一因子表现,也切实增强了组合投资表现[page::8]。


---

2.7 总结与风险提示


  • 总结观点

- 大单因子为传统高频选股因子,受市场结构变化(特别是算法交易普及)影响,表现衰退明显;
- 基于细粒度聚类划分订单类型,结合大单成交后短期走势绩效剔除无效订单的方法,能有效改善大单因子表现和稳定性;
- 改进方法虽未完全恢复早期的优异选股表现,但起到了遏制衰退趋势和提升近年选股能力的作用;
- 由于有效选股的信息严重依赖于基础数据,单纯的统计方法改进难以实现根本逆转,未来需要关注如何更好地利用其风格化特征及结合更多市场信息深化研究。
  • 风险提示

- 本报告仅基于公开数据与分析,不构成投资建议;
- 权益类产品波动大,适合风险承受能力较高的投资者。

---

三、图表与表格深度解析



图1 基于成交金额聚类的成交类型示意图


  • 显示买卖双方以小单、中单、大单三种类型组成的9类成交组合;

- 该结构为后续因子细分提供分类基础,揭示市场参与者不同规模买卖互动的细节。

表1 成交开盘半小时占比因子表现(2016.01-2024.07)


  • 关键发现是中买大卖因子显著负向选股有效,IC约-0.028,IR-5.2,且多空收益-0.54%且胜率仅27.5%;

- 大买大卖因子虽为正IC(0.019),但选股效果相对较弱,胜率64.7%;
  • 说明不同订单组合的市场信息含义复杂,选股效果异质。


表2 大单净买入及构成部分因子表现


  • 大单净买入整体IC为0.032,IR达6.381,表明作为复合指标优于部分单独构成因子;

- 中小买大卖因子IC-0.029,负向选股有效。

表3 主动买卖细分成交因子表现


  • 主动买入大买大卖因子IC和多空收益明显高于主动卖出;

- 说明主动买入行为对选股因子贡献更大。

图2-6 不同成交因子的时间序列IC表现


  • 所有主要因子均呈下滑趋势,主动买入大买大卖因子下滑最缓慢,体现更稳健;

- 表明市场结构演变正在潜移默化影响传统大单因子选股表现。

表4-6 因子改进前后分年度IC比较


  • 改进效果从2017年开始显现,在2021年后尤为明显;

- 主动买入与主动卖出部分改进效果不一,结合复合提升综合表现。

图7-10 及表7 组合增强表现与收益分析


  • 显示加入改进因子后的组合净值明显优于未加入因子版本;

- 超额年化收益提升约1%左右,信息比率和最大回撤指标均有所改善;
  • 说明改进因子具有实际投资应用价值。


---

四、估值分析



该报告聚焦因子研究与优化,未直接涉及传统企业估值模型(如DCF、市盈率等),其核心更多为基于逐笔成交数据的因子构建和时序表现评估,主要量化指标为因子IC和信息比,故此处不涉及标准估值建模的详细分析。

---

五、风险因素评估


  • 市场结构变化(特别是近年机构算法交易与散户结构调整)使因子信息逐步衰减;

- 依赖公开交易数据的因子敏感度有限,信息覆盖不可能完全把握资金面及非公开信息;
  • 改进方法虽然缓解衰退,但能否适应更快变化的市场环境仍存不确定;

- 投资者需注意因子选股效果的时序波动和潜在退化风险。

---

六、批判性视角与细微差别


  • 报告强调了均值与标准差在划分大单时的不足,采用KMedian聚类体现出改进意识和科学性,但该方法本质仍是对成交金额的聚类,未引入其他多维度市场信息,因子性能提升有限。

- 因子衰减虽被技术手段缓解,但未根本逆转,表明基础数据本身或市场环境已限制了因子有效性的进一步提升,这是报告中的关键难点与挑战。
  • 报告内部逻辑严谨,但表格中部分数据(尤其表3部分)有残缺,可能影响部分细节理解,但对整体结论影响不大。

- 评估主动买卖拆分对因子的影响时,报告指出其提升不显著,暗示市场中大单买卖行为复杂,非单纯主动行为所能解释。

---

七、结论性综合



总体来看,海通金工《什么类型的交易更具市场影响?大单因子的研究与改进》报告以严谨的数据驱动方法深入解析了传统大单因子在现代市场的表现特征,通过KMedian聚类细分订单类型,结合主动成交拆分和大单短期绩效指标的引入,对因子构建流程进行系统优化。主要创新点体现在:
  • 用更科学的订单大小划分方法提升了因子分类精度;

- 揭示大单因子的选股效力主要源于特定类型的买卖组合(中买大卖、小买大卖)而非直接大资金买入行为;
  • 发现主动买入大买大卖因子表现最稳定,成为可靠的选股风格;

- 基于短期绩效调整因子剔除无效大单,显著改善长期因子表现与投资组合收益;
  • 组合实证结果验证了该因子改进的有效性,尤其在近三年扭转了因子持续衰退的趋势;

- 报告对基础量价数据因子固有限制的坦诚讨论,为后续研究指明了方向,即结合更多风格和结构特征实现突破。

从投资策略角度,该研究告诫投资者需动态适应市场结构变化,有效在数据与模型层面做结构性优化,应对因子有效性衰退的风险。报告的贡献在于为深入理解成交结构与股票表现的动态关系提供了数据驱动的实证框架,具有重要的实用价值和理论启发。

---

参考文献与数据源


  • 数据来源:Wind资讯、海通证券研究所;

- 报告全文及图表见原文提供的公众号推送及研究报告全文下载链接。

---

(本文分析文本均基于海通证券研究所发布报告内容,具体页码标注采用格式如 [page::x] 以方便溯源。)

报告