`

“量价淘金”选股因子系列研究(八)逐笔买卖差异中的选股信息 ——条件成交不平衡因子

创建于 更新于

摘要

本报告基于逐笔成交数据中主买、主卖信息,构建反转残差非孤立成交不平衡因子,剔除同期涨跌幅影响后提升因子稳定性。该因子在2017-2024年A股数据中表现优异,年化收益超21%,信息比率达2.71,最大回撤低于7%,剔除市场风格后纯净因子信息比率提升至3.05,展现了显著的选股能力和稳健性[page::0][page::14]。

速读内容


成交不平衡因子的构建与初步表现 [page::3]


  • 以每日净买卖单差计算成交不平衡因子,月度IC均值为0.029,年化信息比率(ICIR)为1.46。

- 该因子10分组多空对冲年化收益约14.16%,最大回撤7.06%,表现一般,波动显著。

剔除同期涨跌幅影响:反转残差成交不平衡因子提升效果明显 [page::4][page::5]


  • 反转因子与成交不平衡因子存在正相关性,反转因子的负向预测削弱了成交不平衡因子的效果。

- 通过对成交不平衡因子做同期涨跌幅正交处理,得到反转残差成交不平衡因子,月度IC提升至0.035,年化ICIR提升到2.13。
  • 多空对冲策略年化收益提升至15.71%,最大回撤减小到5.69%。


孤立与非孤立成交的划分及因子改进 [page::6][page::7]


  • 定义成交时间点邻域内是否存在其他成交单区分孤立与非孤立成交。

- 非孤立成交占比约70%,且对应市场信息较为丰富。
  • 分别构建孤立成交不平衡因子与非孤立成交不平衡因子,孤立成交因子IC接近0,无选股价值;非孤立成交因子表现稳定,IC稍高于整体因子。


反转残差非孤立成交不平衡因子表现最佳 [page::8][page::9]


  • 非孤立成交不平衡因子与同期涨跌幅高度正相关,进行正交处理得到反转残差非孤立成交不平衡因子。

- 该因子月度IC均值达0.048,年化ICIR为2.71,10分组多空对冲年化收益21.54%,信息比率2.71,最大回撤6.88%,月度胜率81.11%。
  • 孤立成交因子表现依然较弱,IC负值,回撤高。


纯净反转残差非孤立成交不平衡因子及风格剔除 [page::10][page::13]


  • 因子与Barra常用风格相关性极低(绝对值均小于0.1),显示因子独立性强。

- 剔除风格及行业影响后,纯净因子年化ICIR提高至3.26,信息比率达3.05,最大回撤降至2.6%,年化收益15.26%。
  • 在沪深300、中证500、中证1000和国证2000样本空间均表现有效,特别是在中小市值股票中表现稳健。


参数敏感性测试与因子稳定性验证 [page::11][page::12]


| 参数 | 月度IC均值 | 年化ICIR | 年化收益率 | 信息比率 |
|-------|------------|-----------|-------------|----------|
| δ=10ms | 0.048 | 2.71 | 21.54% | 2.72 |
| δ=50ms | 0.046 | 2.59 | 20.83% | 2.62 |
| 回看20日 | 0.048 | 2.71 | 21.54% | 2.72 |
| 回看60日 | 0.046 | 2.30 | 21.23% | 2.30 |
  • δ邻域越大,因子效果逐渐衰减,原因是孤立与非孤立定义失效。

- 回看天数对因子影响较小,20日回看窗口表现最佳,符合月度换仓周期[page::11][page::12]。

总结 [page::14]

  • 基于逐笔买卖差异,构建了反转残差非孤立成交不平衡因子,剔除涨跌幅及风格干扰后具有显著稳定选股能力和较高收益潜力。

- 回测期涵盖2017年至2024年8月,全市场多空对冲年化收益超21%,最大回撤低于7%。
  • 因子在不同市值股票池表现均有效,具备较强的实用价值和推广前景。

深度阅读

量化专题报告《“量价淘金”选股因子系列研究(八)逐笔买卖差异中的选股信息——条件成交不平衡因子》详尽分析



---

一、元数据与报告概览



报告标题:
“量价淘金”选股因子系列研究(八)逐笔买卖差异中的选股信息——条件成交不平衡因子

作者与发布机构:
国盛证券研究所
分析师沈芷琦、刘富兵及研究助理阮俊烨

发布时间:
最新回测数据截至2024年8月底,报告推断发布时间为2024年10月初左右(参考相关研究更新日期)

主题:
基于A股市场逐笔成交数据的主动买卖方向(主买单与主卖单)信息,研究构建多种成交不平衡相关的有效选股因子,探索推动未来股票收益的微观结构信号。

核心论点与结论:
报告基于主动买卖差异的成交数量构造“成交不平衡因子”,发现该因子原始形式受当期涨跌幅影响存在预测能力削弱问题。通过对因子正交化剔除同期涨跌幅影响,以及创新划分逐笔成交为孤立和非孤立两种类型,提取非孤立成交相关因子,显著提升因子的稳定性和选股能力。最终构建的“反转残差非孤立成交不平衡因子”表现最优,具有较高的月度信息系数(IC)、信息比率(ICIR)和较好的年化收益及风险调整表现,同时与主流风格因子相关性较低,具备良好的纯净选股价值。

---

二、逐节深度解读



1. 前言及数据介绍



报告利用逐笔成交数据,即带有成交时间戳的每笔交易的价格、数量和方向信息。通过标识买卖的主动方向(B=主动买入,S=主动卖出),该数据反映交易双方的激进行为和市场预期差异(第2页)。示例以平安银行逐笔成交片段说明数据结构,包括成交价格、成交量、成交状态及买卖双方订单ID。[page::2]

该数据的高时间分辨率(毫秒级)为精准捕捉市场微观交易行为提供基础。

2. 因子初探:成交不平衡因子(章节2)



2.1 成交不平衡因子的构建


  • 方法

- 统计每日每只股票的主动买入单数与主动卖出单数。
- 计算成交不平衡指标$\frac{\text{主买成交单数}-\text{主卖成交单数}}{\text{主买成交单数}+\text{主卖成交单数}}$,衡量当天净买单强度。
- 月底回看过去20日该指标均值并进行横截面市值中性化,以得最终因子值。
  • 表现

- 2017年1月1日至2024年8月31日全A股回测(剔除ST、停牌、次新股等)显示:
- 月度IC:0.029,年化ICIR:1.46
- 10分组多空对冲年化收益率14.16%,年化波动率9.07%,信息比率1.56,月度胜率75.56%,最大回撤7.06%
- 表现有效但波动较大,效果有限(见图表3)[page::3]

2.2 剔除同期涨跌幅影响:反转残差成交不平衡因子


  • 理论分析

- 净买单多往往伴随当月股价上涨,当月涨跌幅与未来涨跌幅存在负相关。
- 因此,成交不平衡因子同同期涨跌幅正相关,而涨跌幅反转特性弱化因子对未来表现的预测能力。
  • 处理方法

- 对因子值进行对同期20日累计涨跌幅正交化处理,剔除同期涨跌幅影响,形成“反转残差成交不平衡因子”。
  • 结果

- 因子稳定性显著提升:
- 月度IC均值升至0.035,ICIR升至2.13
- 10分组多空对冲年化收益提升至15.71%,波动率降低至7.69%,信息比率增至2.04,最大回撤缩小至5.69%(见图表5、6)[page::4][page::5]

3. 因子增强:条件成交不平衡因子(章节3)



3.1 订单划分:孤立成交与非孤立成交


  • 定义

- 对每笔成交,以其时间点$t$为中心,向前后各延伸$\delta$毫秒时间窗口。
- 若该时间窗口内无其他成交,则该笔为“孤立成交”;
- 否则为“非孤立成交”。
  • 经济含义

- 非孤立成交发生于市场交易活跃期,或因大单拆分产生,信息含量更丰富。
- 孤立成交信息量较弱,可能为孤立零星的撮合。
  • 实证

- 以$\delta=10ms$,统计非孤立成交在一天中大约占成交总数70%,且日内分布较均匀(图表8)[page::6][page::7]

3.2 孤立与非孤立成交不平衡因子的构建及表现


  • 将每日成交拆分为孤立与非孤立两类,分别计算类似成交不平衡指标及其20日均值并中性化。

- 表现
- 孤立成交不平衡因子表现几乎无效,IC接近0甚至负值;
- 非孤立成交不平衡因子表现优于整体因子,IC约为0.032,年化信息比率约1.4(见图表9、10和表11)。
- 对比成交不平衡因子,非孤立成交不平衡因子拥有更高的信息含量与选股能力。

3.3 剔除同期涨跌幅后的条件不平衡因子


  • 孤立和非孤立成交不平衡因子仍与当期涨跌幅显著正相关,尤其是非孤立成交因子相关度更高(相关系数33.44%);

- 采用与前述相同的正交方法,剔除同期涨跌幅影响:
- 反转残差孤立成交不平衡因子表现依然疲弱,月度IC接近-0.015;
- 反转残差非孤立成交不平衡因子显著提升,IC升至0.048,年化ICIR为2.71;
- 10分组多空对冲收益达到年化21.54%,波动率仅7.94%,信息比率2.71,月度胜率高达81.11%,最大回撤6.88%(见图表12-15)[page::8][page::9]

4. 其他重要讨论(章节4)



4.1 纯净反转残差非孤立成交不平衡因子


  • 检验该因子与Barra十大主流风格因子相关度,绝对值均低于0.10,相关性较低,表明是一种较为纯净的Alpha来源(图表16)。

- 进一步剔除行业和风格因素,构建纯净因子。
  • 纯净因子表现指标优异:

- 年化ICIR提升至3.26,
- 年化收益率15.26%,波动率5.00%,信息比率3.05,最大回撤2.60%,月度胜率77.78%(图表17、18)[page::10][page::11]

4.2 参数敏感性测试


  • 对关键参数δ(邻域窗口长度)进行测试,δ取值越大,因子效果逐渐下降,符合预期,因大邻域会导致所有成交均归入非孤立,失去筛选功能(图表19)。

- 因子的回看天数N影响较小,20日附近表现最佳,因子整体稳健(图表20)[page::11][page::12]

4.3 不同样本空间的表现


  • 分别检验因子在沪深300、中证500、中证1000及国证2000等不同股票池的选股能力。

- 反转残差非孤立成交不平衡因子在各指数成分股均保持有效,月度IC在4%~5%左右;纯净因子在大市值沪深300表现也较好,年化ICIR均值提升明显,证明因子具备跨样本的稳定性(图表21、22)[page::12][page::13]

---

三、图表深度解读



图表1(首页)


  • 展示了反转残差非孤立成交不平衡因子在2017年至2024年间10分组表现及多空对冲净值走势。

- 指标表现为分组10(最好分组)净值大幅跑赢分组1(最差分组),对应策略净值稳步上涨,表明因子区分度较强,且趋势明显。
  • 右轴红色虚线表现对冲净值增长,表明多空组合带来的超额收益稳定且持续。


图表3(成交不平衡因子)


  • 显示原始成交不平衡因子10分组策略表现,波动幅度较大,部分时间段显著回撤。

- 多空对冲净值呈上升但波动和回撤较明显,性能一般。

图表4(因子影响机理示意)


  • 清晰展现成交不平衡因子推升当期涨跌幅、而当期涨跌幅却对未来涨跌幅负向预测,产生预测信息互相抵消。

- 直观图示因子与同期涨跌幅的正关联如何影响其对未来收益的有效预测。

图表5、6(反转残差成交不平衡因子)


  • 净值曲线相比图3更加稳定,上升趋势更平滑且更持久。

- 绩效指标明显提升,信息比率接近2,风险调整后回报变更优。

图表7、8(孤立与非孤立成交定义及非孤立占比日内动态)


  • 说明孤立与非孤立成交的时间划分逻辑。

- 非孤立成交占比稳定约70%,表明该笔分类在绝大多数时间可以严格量化市场活跃度。

图表9、10、11(三种因子表现对比)


  • 孤立成交因子净值无明显走势,表明信息量不足。

- 非孤立成交因子表现优于整体因子,提升因子选股效果。
  • 月度IC及信息比率数据显示非孤立成交因子是成交行为中关键信息源。


图表12-15(反转残差孤立与非孤立因子表现及年度表现)


  • 反转残差非孤立因子净值曲线持续上扬,回撤可控。

- 年度绩效广泛为正,除了少数年份轻微负收益,整体表现持续优异。
  • 孤立成交因子依然无效,强化了非孤立成交信息的核心作用。


图表16-18(纯净因子相关性及分年度表现)


  • 纯净因子与风格因子极弱相关,验证了独立Alpha的特性。

- 纯净因子净值曲线和年度表现依旧稳健,最大回撤极低,适合实际策略部署。

图表19-20(参数敏感性和回看窗口测试)


  • δ参数越大,筛选效果减弱,因子效果逐渐向不区分非孤立转变的整体因子靠拢。

- 回看天数对因子IC和多空策略表现有适中影响,20日左右为性能最佳区间。

图表21-22(不同样本空间表现)


  • 因子和纯净因子于不同指数成分股中均显示稳定有效的信息边际,尤其是在中小市值(中证500、1000、国证2000)表现突出。

- 纯净因子风险收益特征更优,最大回撤控制良好。

---

四、估值分析



报告无估值计算内容,PPV因子研究属量化Alpha信号探究性质,无直接估值、目标价涉及,仅提供因子构建及回测业绩分析。

---

五、风险因素评估


  • 明确风险提示:因子表现基于历史数据和统计模型,市场环境显著改变时可能失效,提示模型的历史有效性不代表未来必然表现,存在系统性和结构性风险。

- 未详细提及具体缓解策略,但通过剔除同期涨跌幅及风格行业因子等步骤,提高因子纯净度即为降低风险的内部方法。

---

六、批判性视角与细微差别


  • 因子研究整体全面细致,充分考虑了成交行为的结构异质性,创新孤立/非孤立成交分类有效提升因子信息含量。

- 设定的δ参数选择合理,且进行了敏感性测试,保证方法稳健性。
  • 反转残差处理有力剔除因子与当期涨跌幅负相关带来的干扰,体现严谨因果分析思维。

- 细节上,因子表现仍存在周期性波动,2023与2024部分年度区间指年化收益负或波动加大,需要持续关注市场结构变迁对因子效能的影响。
  • 另外,因子主要基于主动买卖方向计数,未直接考虑买卖金额大小和具体交易者身份,未来可以考虑多维度进一步挖掘因子稳定性。


---

七、结论性综合



本报告作为国盛证券“量价淘金”系列的第八篇,基于逐笔成交的主买单与主卖单数量差异探索有效选股因子,核心贡献在于:
  1. 理论挖掘:首次发现简单成交不平衡因子受当期涨跌幅影响,导致预测能力被反转效应弱化,提出合理的反转残差正交处理,极大提升因子稳定性。
  2. 微观结构创新:引入“孤立”与“非孤立”成交单划分,通过邻域时间窗口捕捉聚集成交行为,筛选出信息量丰富的非孤立成交数据,令因子表现显著优于整体不平衡因子。
  3. 因子表现:回测涵盖2017年至2024年,因子IC均值0.048,年化ICIR达2.71,月度多空对冲年化收益超过21%,信息比率2.71,月度胜率81%强势表现均远超传统因子,且最大回撤控制良好。
  4. 纯净Alpha价值:扣除行业和风格影响后纯净因子ICIR进一步提升至3.26,信息比率3.05,且与Barra主流风格因子相关性低,呈现独立Alpha信号,适合组合中性策略搭建。
  5. 稳健性测试:参数敏感度和样本空间测试均证实因子表现稳健,适应多样投资样本,具有良好的实际应用潜力。


整体而言,该报告系统性揭示了基于逐笔买卖单的微观交易行为信息,尤其是条件成交的结构性差异,如何转化为持续有效的选股因子,并创新性地应用反转残差技术消除当期涨跌幅干扰,极大提升了因子的预测能力与实战价值。该因子为量化投资者提供了一个切实可操作、风险调整收益优异的全球A股Alpha信号来源,且具备扩展及多因子融合潜力。

---

参考图片示例



图表1:反转残差非孤立成交不平衡因子10分组及多空对冲净值



图表5:反转残差成交不平衡因子10分组及多空对冲净值



图表13:反转残差非孤立成交不平衡因子10分组及多空对冲净值



图表17:纯净反转残差非孤立成交不平衡因子10分组及多空对冲净值



---

溯源标注



本分析报告所有数据与内容均直接来源于“量价淘金”选股因子系列研究(八)相关章节与图表[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14]

---

总结: 本报告对基于微观逐笔成交买卖方向差异的选股因子进行了系统深入挖掘,并通过一系列严谨的统计学和量化检验,有效提升了选股因子的预测能力和实用价值。报告的方法论清晰,数据充分,结论稳健,对量化研究和策略开发具有重要借鉴意义。

报告