`

“量价淘金”选股因子系列研究(八)逐笔买卖差异中的选股信息 ——条件成交不平衡因子

创建于 更新于

摘要

本研究基于A股逐笔成交数据,构建并优化了“条件成交不平衡因子”。通过划分孤立及非孤立成交,实现了对买卖单不平衡信息的深度挖掘,纯净反转残差非孤立成交不平衡因子在去除行业及风格影响后,年化信息比率达3.05,10分组多空对冲年化收益21.54%,最大回撤仅6.88%,表现稳健且显著优于基础因子。[page::0][page::3][page::8][page::10][page::14]

速读内容


逐笔成交数据及因子构建背景 [page::2]

  • 利用逐笔成交中主买、主卖方向信息,捕捉投资者激进程度与预期。

- 构建初步成交不平衡因子衡量每日净买单强弱,计算方式为(主买成交单数-主卖成交单数)/(主买成交单数+主卖成交单数)的20日均值,市值中性化处理。

成交不平衡因子表现及反转影响分析 [page::3][page::4][page::5]



  • 成交不平衡因子月度IC均值0.029,年化ICIR1.46,年化收益14.16%,信息比率1.56,最大回撤7.06%。

- 发现成交不平衡因子与同期涨跌幅正相关,涨跌幅与未来收益负相关,导致因子预测能力被削弱。

反转残差成交不平衡因子构建 [page::5]


  • 通过对成交不平衡因子正交化同期20日涨跌幅,剔除反转因子影响。

- 反转残差成交不平衡因子IC平均提高至0.035,年化ICIR2.13,年化收益15.71%,信息比率2.04,最大回撤5.69%。


孤立与非孤立成交定义及因子分解 [page::6][page::7]


  • 孤立成交指成交时间点附近闪现无其他成交,非孤立成交则有其他成交。

- 非孤立成交单信息更丰富,约占当日成交比例70%。
  • 构造孤立成交不平衡因子与非孤立成交不平衡因子。


孤立、非孤立成交不平衡因子表现对比 [page::8]



孤立成交因子表现较弱(IC约-0.005),非孤立成交因子表现良好(IC0.032),略优于总体成交不平衡因子。

反转残差孤立与非孤立成交不平衡因子及绩效 [page::9]




| 因子类型 | 月度IC均值 | 年化ICIR | 年化收益率 | 信息比率 | 最大回撤 |
|-----------------------|------------|----------|------------|----------|----------|
| 反转残差成交不平衡 | 0.035 | 2.13 | - | 2.04 | 5.69% |
| 反转残差孤立成交不平衡 | -0.015 | -0.99 | - | 0.56 | 14.28% |
| 反转残差非孤立成交不平衡| 0.048 | 2.71 | 21.54% | 2.71 | 6.88% |

纯净反转残差非孤立成交不平衡因子及风格中性化后表现 [page::10][page::11]


  • 与Barra风格因子相关性低(绝对值均<0.10)。

- 去除行业及风格影响后,因子ICIR提升至3.26,年化收益15.26%,信息比率3.05,最大回撤下降至2.60%,月度胜率77.78%。

参数敏感性分析 [page::11][page::12]


| δ邻域(ms) | 月度IC均值 | 年化ICIR | 年化收益率 | 信息比率 | 最大回撤 |
|------------|------------|----------|------------|----------|----------|
| 10 | 0.048 | 2.71 | 21.54% | 2.72 | 6.88% |
| 500 | 0.039 | 2.21 | 17.21% | 2.15 | 6.40% |

| 回看天数(交易日) | 月度IC均值 | 年化ICIR | 年化收益率 | 信息比率 | 最大回撤 |
|------------------|------------|----------|------------|----------|----------|
| 20 | 0.048 | 2.71 | 21.54% | 2.72 | 6.88% |
| 60 | 0.046 | 2.30 | 21.23% | 2.30 | 8.03% |

不同样本空间的表现 [page::12][page::13]


| 样本空间 | 月度IC均值 | 年化ICIR | 年化收益率 | 信息比率 | 最大回撤 |
|-----------|------------|----------|------------|----------|----------|
| 全市场 | 0.048 | 2.71 | 21.54% | 2.72 | 6.88% |
| 沪深300 | 0.053 | 1.51 | 11.20% | 0.79 | 20.65% |
| 中证500 | 0.047 | 1.88 | 20.68% | 1.95 | 6.19% |
| 中证1000 | 0.049 | 2.55 | 22.54% | 2.50 | 5.00% |
| 国证2000 | 0.046 | 2.58 | 21.33% | 2.72 | 5.43% |
  • 纯净因子表现优于未中性化版本,且在沪深300也保持稳定盈利能力。


因子总结与投资建议 [page::14]

  • 基于逐笔买卖差异构建的条件成交不平衡因子经过反转剔除与孤立/非孤立划分后,显著提升选股有效性。

- 纯净反转残差非孤立成交不平衡因子展现出较高的预测能力和稳定性,适合用于A股量化选股模型构建与策略开发。
  • 风险提示:因子效果基于历史统计分析,市场环境若发生重大变化,可能影响因子有效性。


深度阅读

国盛证券研究所《“量价淘金”选股因子系列研究(八):逐笔买卖差异中的选股信息——条件成交不平衡因子》详尽分析报告



---

一、元数据与概览


  • 标题:“量价淘金”选股因子系列研究(八)逐笔买卖差异中的选股信息——条件成交不平衡因子

- 作者:沈芷琦、刘富兵、阮俊烨(国盛证券研究所)
  • 发布日期:基于文档近期内容,最新数据截至2024年8月底

- 发布机构:国盛证券研究所
  • 主题:基于逐笔成交数据中的主动买卖差异信息,构建并优化股票选股因子,尤其关注“成交不平衡因子”的创新与增强,深挖交易行为中的选股信息,提升因子选股效果。

- 核心观点与结论
- 初步构建的成交不平衡因子(主买单减主卖单的成交单比率)原始表现一般,受当期涨跌幅的逆相关影响显著;
- 通过剔除同期股票涨跌幅影响(正交化处理),获得反转残差成交不平衡因子,显著提升因子稳定性和收益表现;
- 创新提出“孤立成交”与“非孤立成交”划分,发现非孤立成交单所承载的信息更丰富,构建反转残差非孤立成交不平衡因子,优于整体因子表现;
- 纯净化处理剔除风格和行业影响后,因子选股效果更为稳定,信息比率显著提升;
- 因子在全市场及不同市值分组均表现良好,具备较强的稳健性和应用价值。

---

二、逐节深度解读



1. 前言及数据基础说明


  • 逐笔成交数据提供分秒甚至毫秒级别的交易撮合细节,带有明确的交易时点、价格、数量及方向(主动买入B和主动卖出S)。此数据反映了市场双方激进程度,具有深刻的微观市场结构信息。

- 以2024年8月30日平安银行的部分逐笔数据为例,体现了主动买卖单的具体交易情况和标签用法。
  • 报告从逐笔成交的主买、主卖信息出发,深入构建选股因子,体现国盛金工对市场微观结构数据的量化挖掘思路[page::0,2]。


2. 因子初探:成交不平衡因子(章节2)



2.1 构建方法


  • 逐日统计单只股票内所有逐笔成交的主动买单数和主动卖单数。

- 计算当日成交不平衡指标为(主买单数 - 主卖单数)/(主买单数 + 主卖单数),表现当日净买单强弱。
  • 对20个交易日的指标作移动平均并做市值中性化处理形成因子值。

- 回测时间跨度2017年初至2024年8月,剔除ST、停牌及上市不满60天股票。
  • 初版因子月度信息系数(IC)均值仅为0.029,年化ICIR 1.46,表现不稳,收益年化约14%,回撤7%左右,呈现选股能力有限且稳定性不足(见图表3)[page::3]。


2.2 剔除同期涨跌幅影响的反转残差处理


  • 理论分析揭示当净买单规模较大时,短期价格同时上涨,导致因子与当期涨跌幅存在正相关(相关系数17.59%,秩相关32.19%)。

- 当期涨跌幅自带负向未来价格预测能力,因其与因子正相关,削弱了因子的未来收益预测能力。
  • 通过对成交不平衡因子正交剔除过去20日累计涨跌幅影响,得出“反转残差成交不平衡因子”。

- 回测显示该改进显著提升因子表现,IC均值提高至0.035,ICIR升至2.13,年化收益率提升至15.7%,波动降低,最大回撤降为5.69%(见图4-6、图5)[page::4,5]。

3. 因子增强:条件成交不平衡因子(章节3)



3.1 “孤立”与“非孤立”成交单的定义与统计


  • 通过考察每笔成交时间点附近是否存在其他成交,设定时间邻域δ(默认10毫秒)划分成交单:

- 孤立成交:在邻域内无其他成交。
- 非孤立成交:邻域内有至少一笔成交。
  • 两者理论上信息含量有差异,非孤立成交一般对应市场活跃时间或大单拆分交易,更具代表性。

- 日内非孤立成交占比稳定在70%左右(见图7-8)[page::6,7]。

3.2 基于孤立/非孤立成交的因子拆分与表现


  • 将成交不平衡因子拆分为孤立成交不平衡因子和非孤立成交不平衡因子。

- 孤立成交因子IC接近0,基本无选股能力。
  • 非孤立成交因子IC约0.032,略优于整体成交不平衡因子,表现更为突出(图9-11)[page::7,8]。


3.3 再次剔除同期涨跌幅影响,构建反转残差孤立/非孤立成交不平衡因子


  • 同样方法对孤立、非孤立成交不平衡因子剔除当期涨跌幅影响。

- 反转残差孤立因子仍然效果弱,IC为负,非孤立因子IC提升至0.048,ICIR高达2.71,10分组多空对冲年化收益超21%,最大回撤小于7%,月度胜率超81%(图12-15)。
  • 这一结果表明,仅保留非孤立成交中的成交单做因子,大幅提升了因子在选股中的信息含量与预测能力[page::8,9].


4. 其他重要讨论(章节4)



4.1 纯净因子与行业风格中性化


  • 通过每月对Barra风格因子及中信一级行业进行多元回归提取残差,构造风格和行业中性化的“纯净反转残差非孤立成交不平衡因子”。

- 新因子与风格因子相关性极低(绝对值均<0.10;见图16),说明捕获了差异化的选股信息。
  • 纯净因子表现进一步提升,年化ICIR达到3.26,收益稳健,信息比率可达3.05,最大回撤仅2.6%,表现极为优异(见图17-18)[page::10,11]。


4.2 参数敏感性分析


  • 主要参数包括邻域时间δ和回看天数N。

- 以δ为例,10毫秒邻域时因子效果最佳,逐渐增大邻域(扩大时间窗口)后,因子IC和信息比率有所下降,表现趋近未划分订单时的整体因子效果,验证了孤立/非孤立划分合理性(见图19)。
  • 对回看天数敏感性测试显示,回看20日为最佳选择,稍长的40、60日回看天数因子表现略有下降,但整体稳定(见图20)[page::11,12]。


4.3 不同样本空间应用效果


  • 反转残差非孤立成交不平衡因子及其纯净版本在沪深300、中证500、中证1000、国证2000成分股中均表现有效。

- 在大市值股票池(沪深300)中,因子依然有明显的选股能力,月均IC达到4%-5%。
  • 成果显示因子具备广泛适用性和良好的稳健性(见图21-22)[page::12,13]。


---

三、图表深度解读



图表1(页0):


  • 展示反转残差非孤立成交不平衡因子10分组及多空对冲净值走势。

- 右轴为组10对冲组1的净值指数,左轴为分组净值。
  • 可见分组间表现分化明显,组10强于组1,净值稳步攀升至约4倍以上,显示因子择时能力强。

- 该图直观反映了因子收益稳定性和收益率高,支持主要结论[page::0]。

图表3(页3):


  • 展示初步成交不平衡因子10分组及多空对冲净值。

- 整体现象为因子收益的分组分化,但净值走势波动增大,且近期回撤明显,信息比率中等。
  • 说明初步因子有效但有改进空间[page::3]。


图表4(页4):


  • 逻辑关系示意图,显示成交不平衡因子既正向预测未来涨跌幅,也推动当期涨跌幅,而当期涨跌幅与未来涨跌幅负相关,导致影响冲突,减少因子实际预测能力。

- 图解清晰阐述核心负面影响机制[page::4]。

图表5-6(页5):


  • 图5为反转残差成交不平衡因子绩效,显示分组净值更为稳定且收益提升。

- 图6对比交易不平衡因子与其反转残差版本的IC及多项绩效指标,全面展现改造后因子优势(IC和年化收益提升,波动及回撤降低)[page::5]。

图表7-8(页6-7):


  • 图7为孤立与非孤立成交定义示意,通过时间邻域概念形象解释分类逻辑。

- 图8展示非孤立成交单日内占比分布,基本稳定于70%左右,说明非孤立成交普遍存在,且广泛覆盖全天交易[page::6,7]。

图表9-11(页8):


  • 图9孤立成交因子净值走势平缓无明显表现。

- 图10非孤立成交因子净值明显优于孤立成交因子,空间分层显著。
  • 图11表格量化指标体现孤立因子IC接近零,非孤立因子IC优于整体因子,初步验证理论[page::8].


图表12-15(页9):


  • 图12孤立成交反转残差因子仍弱势。

- 图13非孤立成交反转残差因子净值更稳健且收益率显著。
  • 图14表格对比上述各因子IC及多项绩效,信息比率高达2.71,月度胜率81%,表现突出。

- 图15年化分年度回报表,展现因子多年稳定性,尽管2024年至8月市场较为疲软,但整体仍显示良好抗风险能力[page::9]。

图表16-18(页10-11):


  • 图16相关系数表明反转残差非孤立成交不平衡因子与传统Barra风格因子相关度极低,捕获独立信息。

- 图17纯净因子净值曲线更平稳,信息分布更均匀。
  • 图18纯净因子年化表现及各绩效指标,胜率、信息比率等均有提升,特别回撤控制更优[page::10,11]。


图表19-20(页11-12):


  • 图19显示δ邻域参数敏感性,因子效果在10-50ms区间稳定,越大则判为非孤立成交单越多,因子区分能力下降。

- 图20回看天数敏感度影响不大,20日区间表现好,适合月度回测频率[page::11,12].

图表21-22(页12-13):


  • 展示因子在不同股票池(全市场及各指数样本)中各类绩效指标。

- 反转残差和纯净因子均在各样本空间有效,且在大盘股沪深300中依然展现出显著的稳定选股能力。
  • 最大回撤在不同样本间波动合理,表明因子稳健性[page::12,13]。


---

四、估值分析



本报告聚焦量价因子挖掘与验证,不涉及具体企业或行业估值。因子定价基于实证回测、信息系数、年化收益率、信息比率等统计指标评估因子预测能力和实用价值。

---

五、风险因素评估


  • 该因子基于历史微观数据和统计模型构建,风险提示明确指出未来市场环境若发生明显变化,或因子所依赖的微观结构发生改变,可能导致模型失效。

- 结构化风险包括市场流动性极端变化、交易规则修订、投资者行为模式改变等。
  • 报告未具体提出缓解方案,投资者使用时需结合实时市场动态和风险控制框架谨慎应用[page::0,14]。


---

六、批判性视角与细微差别


  • 报告对因子正向效果揭示充分且数据详实,但成绩主要基于统计回测,尚缺少对极端市场环境下因子表现的深入探讨,尤其2024年部分样本出现负收益,值得深入研究。

- 正交剔除同期涨跌幅虽提升因子性能,但该过程也可能弱化部分真实信号,一定程度在实盘中可能面临信号噪声权衡问题。
  • 孤立成交订单定义及δ参数选择虽做了敏感性测试,但在不同市场波动状态下,时间窗口需动态调整以匹配不同流动性状况,这方面未来可拓展。

- 纯净因子剔除行业及风格影响后表现更好,但是否存在过度拟合风险需进一步实证验证。
  • 该因子对主买/主卖方向判定准确性依赖基础数据质量,可能受限于交易机制及撮合逻辑,存在潜在的分类误差风险。


---

七、结论性综合



本报告通过细致探索逐笔成交数据中买卖单差异,针对日度净买单强弱构建初版成交不平衡因子,结合市场行为的反转特性,创新提出“反转残差成交不平衡因子”显著改善预测能力。进一步联合“孤立与非孤立成交”划分概念,精准筛选信息量丰富的“非孤立成交”数据,构成的反转残差非孤立成交不平衡因子在统计指标上显著优于初始因子,展现了高稳定性、较高的IC、信息比率和丰厚的年化收益,月度胜率高达81%以上,最大回撤控制在合理范围。

除去行业风格等已有风险因素干扰后形成的纯净因子,进一步提升了因子稳定性和选股效率,表明该因子捕获了独立且有效的择时和选股信息。在不同市值及样本空间中均展现较好普适性,彰显应用价值。参数稳健性测试支持因子构建逻辑,表明该方法框架合理。

图表分析从基础数据处理(图2)、分组收益表现(图3、图5、图9、图10、图13、图17)到IC及各绩效表格(图6、图11、图14、图16、图19、图21、图22)形成清晰的逻辑线索,直观而丰富地支撑报告结论。

总体来看,国盛证券《“量价淘金”选股因子系列研究(八)》充分利用交易微观结构数据,创造性地建立了有力的成交不平衡类因子体系,具备良好的实用性和研究价值,为量化投资中挖掘投资者交易行为信息、提升择时选股策略效果提供了宝贵经验和方法论。风险提示明确,投资者应结合动态市场环境与多因子体系谨慎应用。

---

参考溯源标注



[报告内容涵盖所有章节,主要引用了如下页码:]
[page::0,2,3,4,5,6,7,8,9,10,11,12,13,14]

---

附录:关键图表支持(示例)



-

-

-

---

以上为本次报告的详尽剖析与解读。

报告