“量价淘金”选股因子系列研究(八)逐笔买卖差异中的选股信息 ——条件成交不平衡因子
创建于 更新于
摘要
本报告基于逐笔成交数据中的主买、主卖信息,构建条件成交不平衡因子,通过剔除同期涨跌幅影响及筛选非孤立成交,提升因子稳定性和选股效果。反转残差非孤立成交不平衡因子在2017-2024年A股样本中表现最佳,年化收益达21.54%,信息比率2.71,最大回撤6.88%,剔除市场风格影响后效果更显著,年化ICIR提升至3.26[page::0][page::3][page::4][page::8][page::14]
速读内容
一、成交不平衡因子构建及初步表现 [page::3]

- 以(主买成交单数-主卖成交单数)/(买单+卖单)计算每日成交单不平衡指标
- 月度IC均值0.029,年化ICIR1.46,10分组多空对冲年化收益14.16%,信息比率1.56,最大回撤7.06%
- 因子表现一般,波动及回撤在近几年加剧
二、剔除同期涨跌幅影响:反转残差成交不平衡因子效果提升 [page::4][page::5]

|指标|成交不平衡因子|反转残差成交不平衡因子|
|-|-|-|
|月度IC均值|0.029|0.035|
|年化ICIR|1.46|2.13|
|年化收益率|14.16%|15.71%|
|年化波动率|9.07%|7.69%|
|信息比率|1.56|2.04|
|月度胜率|75.56%|75.56%|
|最大回撤|7.06%|5.69%|
- 成交不平衡因子与同期涨跌幅存在正相关,后者负预测未来涨跌幅影响因子效果
- 通过正交处理反转因子,显著提升IC和多空绩效
三、孤立与非孤立成交单划分及因子增强 [page::6][page::7][page::8]

- 提出孤立成交(邻域内无其他成交)与非孤立成交(邻域内有其他成交)
- 非孤立成交占比约70%,信息含量更丰富
- 孤立成交不平衡因子IC接近于0,无选股效果
- 非孤立成交不平衡因子表现较好,月度IC均值0.032,年化ICIR1.40,信息比率10.12%
|指标|成交不平衡因子|孤立成交因子|非孤立成交因子|
|-|-|-|-|
|月度IC均值|0.029|-0.005|0.032|
|年化ICIR|1.46|-0.34|1.40|
|年化收益率|14.16%|0.84%|15.88%|
|信息比率|1.56|0.13|1.57|
|最大回撤|7.06%|13.28%|8.06%|
四、反转残差非孤立成交不平衡因子表现最优 [page::9][page::14][page::15]

|指标|反转残差成交因子|反转残差孤立成交因子|反转残差非孤立成交因子|
|-|-|-|-|
|月度IC均值|0.035|-0.015|0.048|
|年化ICIR|2.13|-0.99|2.71|
|年化收益率|15.71%|3.83%|21.54%|
|信息比率|2.04|0.56|2.71|
|月度胜率|75.56%|60.00%|81.11%|
|最大回撤|5.69%|14.28%|6.88%|
- 年化收益率最高,选股表现最佳
- 在剔除市场风格和行业影响后,纯净因子年化ICIR提升至3.26,收益稳定性进一步增强
- 因子与Barra风格因子相关性均小于0.10,具备较强的独立选股能力

五、参数敏感性及样本空间表现 [page::11][page::12][page::13]
|δ邻域(ms)|10|30|50|100|300|500|1000|
|-|-|-|-|-|-|-|-|
|月度IC均值|0.048|0.047|0.046|0.045|0.041|0.039|0.037|
|年化收益率|21.54%|20.81%|20.83%|19.86%|17.87%|17.21%|16.16%|
|信息比率|2.72|2.60|2.62|2.43|2.23|2.15|2.02|
|样本空间|全市场|沪深300|中证500|中证1000|国证2000|
|-|-|-|-|-|-|
|月度IC均值|0.048|0.053|0.047|0.049|0.046|
|年化收益率|21.54%|11.20%|20.68%|22.54%|21.33%|
|信息比率|2.72|0.79|1.95|2.50|2.72|
- δ参数和回看日数对因子表现影响有限,但取值过大会削弱孤立与非孤立分类的意义
- 反转残差非孤立成交不平衡因子在大、中、小市值股票池均有良好表现,尤其对中小市值表现尤为突出[page::11][page::12][page::13]
六、风险提示 [page::0][page::14]
- 以上结论基于历史数据和统计模型,市场环境若发生显著变化可能导致模型失效
深度阅读
国盛证券“量价淘金”选股因子系列研究(八)详尽分析报告
---
一、元数据与概览
- 报告标题:“量价淘金”选股因子系列研究(八)——逐笔买卖差异中的选股信息——条件成交不平衡因子
- 发布机构:国盛证券研究所
- 报告时间:2024年(具体发布时间未明,但含2024年8月底数据)
- 作者及团队:沈芷琦、刘富兵、阮俊烨(具备中国证券业协会证券投资咨询执业资格)
- 研究主题:基于逐笔成交数据中“主买”和“主卖”方向信息,构建和优化成交不平衡类选股因子,利用高频微观数据发掘股票未来收益的预测信号。
报告核心论点总结:
- 成交不平衡因子的构建与表现:
基于每日股票逐笔成交中主买单与主卖单数量差异,构造成交不平衡因子。初步因子表现一般,受到当月自身涨跌幅的负相关性拖累,导致预测未来收益能力较弱。
- 反转残差因子改进:
通过对成交不平衡因子进行同期涨跌幅的正交化处理(剔除当期涨跌幅影响),生成反转残差成交不平衡因子,显著提高了稳定性和选股能力。
- 孤立与非孤立成交数据划分:
通过“δ邻域内是否存在其他成交单”区分孤立与非孤立成交单,非孤立成交单通常对应活跃和信息含量更丰富的交易时刻。
- 反转残差非孤立成交不平衡因子的强化效果:
针对此筛选的非孤立成交数据构建因子,剔除当期涨跌幅干扰后获得最佳选股表现,月度信息系数(IC)及年化信息比率(ICIR)均显著领先其他版本因子,年化收益率超21%,且风控指标良好。
- 纯净因子:
进一步剔除市场常见风格因子和行业影响后,因子稳定性再获提升,信息比率达到3.05,展现较高的独立选股价值。
- 风险提示:
强调结果基于历史数据模型,未来市场环境若有变化,模型失效风险存在。
---
二、逐章深度解读
1. 前言与数据背景
- 逐笔成交数据时间精度高达毫秒,包含每笔交易的价格、成交量、时间及买卖双方主动性信息(“B”主动买入,“S”主动卖出)。
- “主买”与“主卖”反映了交易双方激进程度差异,是判定市场单个标的多空力量的重要信息来源。
- 平安银行2024年8月30日逐笔交易数据示例(图表2)体现了数据的具体形态和方向标记。[page::0,2]
---
2. 因子初探:成交不平衡因子
2.1 成交不平衡因子构建
- 核心设计思路:若过去一段时间内买方主动成交明显优于卖方,推测买方占优,未来股票收益可能更佳。
- 计算方法:
每日成交不平衡指标 = (主买成交单数 - 主卖成交单数) / (主买成交单数 + 主卖成交单数)
再对过去20个交易日的该日指标取均值并做市值中性化处理,得到月度因子值。
- 性能表现:
- 月度IC均值0.029,年化ICIR仅1.46,信息比率1.56,最大回撤7.06%。
- 图表3显示该因子10分组多空对冲的净值曲线整体呈上升,但波动与回撤明显,尤其近年来表现不稳。[page::3]
2.2 剔除同期涨跌幅的影响
- 发现成交不平衡因子与当期涨跌幅存在正相关(相关系数达17.59%)
- 由于当期涨跌幅与未来涨跌幅负相关,导致成交不平衡因子预测能力被削弱(反转因子IC为负但与成交不平衡因子正相关)
- 解决方案为对成交不平衡因子做同期涨跌幅的正交化处理,得到“反转残差成交不平衡因子”,显著提升稳定性与预测能力。
- 性能提升:
- 月度IC均值提升至0.035,年化ICIR达2.13,10分组多空对冲年化收益提升至15.71%,最大回撤改善至5.69%。
- 图表5、6分别展示正交化处理后因子的表现与和原因子对比。[page::4,5]
---
3. 因子增强:条件成交不平衡因子
3.1 订单划分:孤立与非孤立成交
- 定义:某笔成交单若在成交时间点窗口(±δ毫秒)无其他成交单,即判定为孤立成交;反之为非孤立,该δ参数初取10ms。
- 逻辑:非孤立成交对应市场高成交活跃期,信息含量丰富;孤立成交往往信息稀薄。
- 图表7示意该划分规则,图表8显示非孤立成交在日内各时间段占比维持70%左右,分布稳定。[page::6,7]
3.2 构建孤立与非孤立成交不平衡因子
- 做法:按照成交单划分分别计算孤立与非孤立成交不平衡指标,月度回看20日后市值中性化处理。
- 表现差异:
- 孤立成交不平衡因子基本无选股效果,月度IC接近0甚至为负。
- 非孤立成交不平衡因子IC优于整体因子,呈现稳定的正向预测能力。
- 图表9、10以及图表11数据清晰展现孤立与非孤立因子表现对比。[page::7,8]
3.3 剔除同期涨跌幅的扰动:反转残差孤立与非孤立成交不平衡因子
- 孤立成交因子与当期涨跌幅呈负相关,非孤立成交因子相关性显著更强,为33.44%。
- 因此对二者均进行同期涨跌幅正交化处理,以剔除当期涨跌幅影响,反转残差非孤立成交不平衡因子表现最优。
- 绩效指标:
- 非孤立成交因子月度IC达0.048,年ICIR2.71,年化收益率21.54%,信息比率2.71,最大回撤6.88%,月度胜率高达81.11%。
- 相较之下,孤立成交因子依然表现较弱,IC为负。
- 图表12至图表15详细展示分组净值走势及年度绩效明细。[page::8,9]
---
4. 其他重要讨论
4.1 纯净反转残差非孤立成交不平衡因子
- 对因子剔除Barra十风格因子及中信一级行业效应后,取得纯净因子,最大限度剥离市场风格干扰。
- 结果显示相关性指标均小于0.1,纯净因子仍保有稳定的因子表现,年化ICIR提升至3.26,信息比率升至3.05,最大回撤降至2.6%。
- 图表16至图表18体现纯净因子与市场风格相关度及其净值走势与年度表现。[page::10,11]
4.2 参数敏感性测试
- 主要敏感参数为孤立与非孤立成交定义中的邻域宽度δ,以及月度选股因子回看的交易日长度N。
- δ取值从10ms逐步增加至1000ms,因子表现随着δ升高逐渐下降,说明过宽的邻域将大部分成交定义为非孤立,削弱筛选信息的分辨力。
- 选择10ms时因子效果最佳(IC均值0.048,ICIR 2.71,年化收益21.54%),回看期N约20日表现最佳且稳定,且35-60日范围内因子表现稳健。[page::11,12]
4.3 跨样本空间表现验证
- 在沪深300、中证500、中证1000及国证2000等不同市值规模及风格的股票池检验,反转残差非孤立成交不平衡因子均维持正向有效的选股能力。
- 尤其是在沪深300大盘股池中,月度IC可达到4%-5%,表现优于多数量价类因子。
- 纯净因子在不同样本中的ICIR及信息比率表现也持续稳健。[page::12,13]
---
三、图表深度解读
- 图表1(图表13页0)展示了反转残差非孤立成交不平衡因子10分组及多空对冲净值走势。
曲线显示,排名最高(10组)与最低(1组)分组净值曲线分化明显,右轴的对冲净值呈持续上行趋势,表明因子区分能力强且稳定获利。
- 图表3(第3页)成交不平衡因子原始表现,净值增长有但波动大,回撤风险突出,近年业绩波动加剧,显示初始因子稳定性不足。
- 图表4(第4页)构造了因子影响路径示意图,明显指出成交不平衡因子正向影响未来涨跌幅,但同时强正影响当期涨跌幅,而当期涨跌幅与未来涨跌幅呈负向关联,形成抑制效果。为保证预测准确性,必须剔除当期涨跌幅影响,切入“反转残差”。
- 图表5、6(第5页)反转残差因子涨净值线稳步上升,且各绩效指标均优于原始因子;多维度展现调整后因子的稳定性和收益提升。
- 图表7(第6页)孤立与非孤立成交的时间区间示意,清楚说明了孤立成交是无邻近成交对应的孤立时间点,非孤立则相反。
- 图表8(第7页)非孤立成交占比基本稳定,约70%,说明市场活跃时段大部分成交均为非孤立,支持其信息含量更丰富的假设。
- 图表9、10、11(第8页)孤立成交因子表现几乎无效,净值趋势无明显分化,IC指标为负,而非孤立成交因子表现明显优于整体因子,验证筛选流动性强信息含量较高的成交数据提升因子有效性。
- 图表12、13、14、15(第9页)反转残差孤立成交因子表现仍弱,非孤立成交因子保持强势且分组净值差异明显,呈长期正收益趋势,年度间表现稳定,最高年化收益达28%以上,最低年度收益率虽为负,但整体表现出较高稳健性。
- 图表16、17、18(第10、11页)展示纯净因子与经典风格因子高度去相关,并保持净值稳步增长,分年度稳健表现,混合行业中性化后因子更为纯粹,有效避免风格偏差干扰。
- 图表19、20(第11、12页)参数敏感性试验显示因子对δ邻域和回看天数设置相对稳健,10ms邻域和20日回看期优化了预测性能。
- 图表21、22(第12、13页)因子在多种不同样本空间的检验,均表现出较强选股能力,且纯净因子在大中盘股票池中依然有效,显示因子较强普适性。
---
四、估值分析
本报告为量化选股因子研究,未涉及传统的公司估值模型(如DCF、P/E、市净率等)构建,而是从因子表现的IC、ICIR、信息比率、年化收益率和最大回撤等多维量化指标切入,综合评价因子质量和稳定性。
- 信息系数(IC):反映因子当期值与未来收益的相关度,是因子有效性的关键指标。
- ICIR(信息比率):IC均值与IC标准差的比值,反映因子预测的稳定性和质量。
- 多空对冲收益率及波动率:模拟多空策略的历史收益和风险表现。
- 最大回撤:衡量极端负收益风险。
因子经过层层处理与精炼,最终版本表现具备较高的投资价值和相对优异的风控指标。
---
五、风险因素评估
报告明确提示:
- 本研究基于历史数据和统计模型测算,未来市场环境若发生重大变化,存在模型失效风险。
- 量化因子表现具备一定的历史可持续性,但不能保证永远有效,需动态监控。
- 因子本质依赖于高频交易数据,交易行为的结构性变化(比如监管、交易机制改革)可能破坏因子逻辑。
- 报告未涉及策略实施的交易成本、滑点等实际交易执行风险。
总体,风险提示较为全面、谨慎。
---
六、批判性视角与细微差别
- 报告针对成交不平衡因子原始表现不足,深入挖掘涨跌幅负相关拖累问题进行反转残差处理,理论逻辑与实证分析兼备,较为严谨。
- 将孤立与非孤立成交细分概念引入,突出信息质量区分,创新性明显。
- 纯净因子处理剔除风格与行业影响,使因子更具独立alpha的判断力,体现良好研究深度。
- 报告对参数敏感性和样本空间稳健性测试充分,增强了结论说服力。
- 缺点或注意点:
- 模型和因子依赖在高频精确的逐笔成交数据,数据可得性与准确性要求高。
- 未对策略实施成本、市场冲击和流动性限制做深入讨论。
- 时间窗口和市场截面的选择存在一定主观,实际效果变化需持续跟踪。
- 部分年度表现(如2024年至今)收益有较大波动,需关注因子在不同市场环境下的适应性问题。
- 图表中部分表格排版混乱,需对部分数据解读有更多细节说明(如图表11,部分指标数值未完全清晰)。
- 结论较为慎重,未出现过度乐观的表述,整体体现较强的学术与实战结合的平衡。
---
七、结论性综合
国盛证券团队通过对逐笔成交数据中的主动买卖方向差异进行了深入挖掘,提出了“成交不平衡因子”及其衍生的“反转残差成交不平衡因子”,进一步基于成交时间邻域将订单划分为孤立和非孤立两类,筛选非孤立成交数据构建了“反转残差非孤立成交不平衡因子”,显著优化了选股因子的稳定性和预测能力。
主要成果包括:
- 经过同期涨跌幅正交化处理,因子IC和ICIR水平明显提升,月度IC约0.048,年化ICIR达2.71,表明因子对未来收益具有较强判断力。
- 基于非孤立成交数据构建因子使得信号更纯、更稳定,将主动成交的市场活跃时段信息充分利用,产生了年化超过20%的多空对冲收益,且月度胜率长期保持81%以上。
- 纯净因子剔除市场风格和行业效应后,表现更为突出,年化ICIR提升至3.26,信息比率3.05,最大回撤仅2.6%,显示因子具备高质量alpha属性。
- 因子证明具有跨市值范围广泛适用性,在沪深300等大盘股中依然保持稳定选股能力,且参数设置对因子效果具有较强鲁棒性。
- 遵循严谨的量化研究流程,包含理论假设、数据描述、实证验证、参数敏感性分析和风险提示,确保了研究的科学性和可操作性。
整体而言,该系列研究首次系统展示了基于逐笔主买卖差异及成交时间邻域筛选,挖掘微观交易行为信息的有效路径,为量化选股因子提供了创新方向,并在中长期实证测试中展现稳定出色的业绩表现。[page::0-14]
---
免责声明
本报告的信息基于公开数据和研究模型,未来表现不保证。投资者应结合自身情况理性使用,注意市场和模型风险,避免盲目跟随。报告版权归国盛证券所有,引用需注明出处。[page::15]
---
总结
本报告通过严谨的数据分析和创新因子设计,挖掘逐笔买卖方向差异中的潜在Alpha信号,充分展现了高频微观结构数据在股票量化选股领域的巨大潜力,提出的反转残差非孤立成交不平衡因子,成为一个兼具理论合理性、实证验证、风险控制和操作稳健性的优质选股因子,具备良好的行业参考价值。
---
若有需要,可对各章节和图表提供更细致技术解读。