【国盛金工 量价选股】逐笔买卖差异中的选股信息 条件成交不平衡因子
创建于 更新于
摘要
本文基于逐笔成交数据的主买、主卖信息,构建并优化成交不平衡因子,提出孤立与非孤立成交的划分方法,通过剔除同步涨跌幅的影响得到反转残差非孤立成交不平衡因子,实现了因子稳定性的显著提升,回测结果显示该因子在全A股具有良好的选股能力和较高的信息比率,剔除常用风格和行业影响后纯净因子的表现更优,适合量化选股应用 [page::0][page::4][page::7][page::12]
速读内容
- 成交不平衡因子的初步构建和回测表现 [page::2][page::3][page::4]:

- 以每日净买单(主买单数减主卖单数)占比为基础构建因子,20日滚动均值市值中性化。
- 月度IC均值0.029,年化ICIR 1.46,年化收益率14.16%,信息比率1.56,最大回撤7.06%。
- 该因子表现受当期涨跌幅影响,存在负相关修正需求。
- 反转因子对成交不平衡因子效应的削弱及正交处理 [page::3][page::4]:

- 成交不平衡因子与20日累计涨跌幅正相关,而后者与未来涨跌幅负相关。
- 通过正交同期涨跌幅,构建反转残差成交不平衡因子,IC均值提升至0.035。
- 年化收益率提升至15.71%,信息比率提升至2.04,最大回撤下降至5.69%。
- 成交单孤立性划分及因子细分 [page::5][page::6][page::7]:


- 定义孤立成交单(成交时间邻域内无其他成交)与非孤立成交单。
- 非孤立成交单占比约70%,信息含量更丰富。
- 分别构建孤立和非孤立成交不平衡因子,非孤立因子IC均值0.032,年化收益15.88%,孤立因子表现较弱。
- 优化反转残差非孤立成交不平衡因子及回测结果 [page::7][page::8][page::9][page::12]:


- 反转残差非孤立成交不平衡因子月度IC均值提升至0.048,年化ICIR达到2.71。
- 10分组多空对冲年化收益21.54%,信息比率2.71,最大回撤6.88%。
- 剔除市场常用风格及行业影响后,纯净因子ICIR达3.26,年化收益15.26%,最大回撤仅2.60%。
- 参数敏感性与样本空间扩展测试 [page::10][page::11]:
- 邻域参数8设为10毫秒为最佳,较大参数导致因子效果衰减。
- 回看窗口20日左右最佳,因子表现稳健,月度胜率超80%。
- 因子在沪深300、中证500、中证1000及国证2000样本空间均表现有效,且纯净因子稳定性更强。
- 量化因子总结与投资建议 [page::12]:
- 该因子基于逐笔成交主动买卖行为数据,提炼出具备前瞻性的非孤立成交不平衡信号。
- 通过剔除同步涨跌幅及风格行业影响,得到纯净高稳定度因子。
- 具有较高的年化收益和信息比率,适合作为量化选股与风格轮动的核心因子之一。
深度阅读
【国盛金工 量价选股】逐笔买卖差异中的选股信息——条件成交不平衡因子 研究报告详尽分析
---
1. 元数据与报告概览
- 报告标题:《逐笔买卖差异中的选股信息——条件成交不平衡因子》
- 作者:沈芷琦、阮俊烨、刘富兵
- 发布机构:国盛证券金融工程团队
- 发布日期:2024年10月10日
- 主题:基于逐笔成交数据的买卖单差异构建选股因子,重点研究“成交不平衡因子”的设计、优化及提升版本——反转残差非孤立成交不平衡因子及其纯净版本。
- 核心论点:研究利用微观逐笔成交买卖方向信息,发现通过区分“孤立”与“非孤立”成交单,剔除成交因子与当期涨跌幅的正相关影响后,构建出的反转残差非孤立成交不平衡因子具备显著稳定的正向预测能力,能够有效选股,实现较高的信息比率和收益表现。
- 目标:本文旨在发掘逐笔成交数据中潜藏的买卖差异信号,通过创新数据处理和因子设计提升选股模型的预测能力。
---
2. 逐节深度解读
2.1 研究背景与数据说明
- 报告基于逐笔成交数据,精准捕捉每笔买卖订单的成交时间(毫秒级)、成交价格、数量及方向信息。
- 方向被定义为“主动买入(B)”或“主动卖出(S)”,反映双方成交的主动/被动关系,是测量市场参与者激进行为及预期的重要维度。
- 以平安银行(000001.SZ)2024年8月30日数据作示例展示具体交易订单结构及方向确认,强化对方法学的理解。
---
2.2 成交不平衡因子初探
- 构建过程:
1. 每交易日计算(主买单数 - 主卖单数)/(总成交单数)衡量日内买卖单不平衡程度。
2. 回溯过去20个交易日不平衡指标平均值,做市值中性处理,形成每日因子值。
- 假设及逻辑:买方主导成交更多的股票未来收益会更高。
- 回测发现:该因子在2017-2024年回测表现一般,月度IC均值仅0.029,年化信息比率(ICIR)1.46,10分组多空对冲年化收益14.16%,波动9.07%,信息比率1.56,最大回撤7.06%。
- 不足分析:因子与当期涨跌幅正相关(相关系数17.59%,秩相关32.19%),而当期涨跌幅与未来涨跌幅负相关,导致成交不平衡因子的未来表现被削弱。
---
2.3 反转残差成交不平衡因子
- 方法改进:采用对成交不平衡因子与过去20日累计涨跌幅进行正交化处理,剔除因子对当期涨跌幅的解释部分。
- 效果提升:反转残差成交不平衡因子月度IC均值提升至0.035,年化ICIR提升至2.13, 多空对冲年化收益小幅跃升至15.71%,波动降低至7.69%,信息比率2.04,最大回撤缩小至5.69%。
- 结论:正交处理有效排除因子与当期行情的混淆,增强未来收益的预测纯净性。
---
2.4 孤立与非孤立成交的划分
- 定义:
- 孤立成交单:某笔成交订单在其成交时间点的邻域区间(默认10毫秒内)没有相邻成交单。
- 非孤立成交单:邻域内存在其他成交订单。
- 假设:非孤立成交反映市场交易活跃度高或大单拆分,具有更丰富的市场信息含量。
- 日内分布:非孤立成交单占比约70%,较为均匀分布于全天时段。
---
2.5 孤立与非孤立成交不平衡因子表现
- 拆分构建:独立计算孤立与非孤立成交单的成交不平衡指标,形成两个子因子。
- 回测结果:
- 孤立成交不平衡因子几乎无预测能力(月度IC接近0,年化收益0.84%),表现弱。
- 非孤立成交不平衡因子IC约0.032,年化收益15.88%,与整体因子相比有提升,验证了非孤立成交信息含量更丰富的假设。
---
2.6 剔除同期涨跌幅影响后构建反转残差非孤立成交不平衡因子
- 相关性测度:
- 孤立成交因子与20日累计涨跌幅呈负相关,非孤立成交因子呈强正相关(33.44%/45.99%),表明非孤立因子受当期涨跌幅影响较大。
- 改进:剔除因子与当期涨跌幅的关联,取残差构成反转残差孤立和非孤立成交不平衡因子。
- 结果表现:
- 反转残差非孤立成交不平衡因子月度IC0.048,年化ICIR2.71,10分组多空对冲收益21.54%,年化波动7.94%,信息比率2.71,最大回撤6.88%。
- 反转残差孤立因子仍表现较弱。
- 年度表现:反转残差非孤立因子在多数年份展现较高收益和稳健风险指标,表现稳定可靠。
---
2.7 纯净反转残差非孤立成交不平衡因子
- 风格剔除:回归剔除10个Barra风格因子和行业虚拟变量,获得纯净因子,消除因子被常用风险因子覆盖的可能。
- 效果:
- 年化ICIR上升至3.26,年化收益15.26%,波动率大幅降低至5.00%,信息比率3.05,最大回撤2.60%,月度胜率近78%。
- 纯净因子展现更强的稳定性和抗风险能力。
- 风格相关系数极低(均小于0.10),表明因子捕捉的是独立于传统风格的市场微观行为信号。
---
2.8 参数敏感性测试与样本空间适应性
- 邻域参数敏感性:随着邻域时间窗口从10ms扩大到1000ms,因子效果逐步衰减。邻域过大导致大部分订单均判定为非孤立,模糊了信息筛选效果。
- 回看窗口:20日回看窗口与月度调仓频率匹配,有效性最佳,回看40、60日稍有下降。整体表现稳健。
- 样本空间:因子在沪深300、中证500、中证1000、国证2000各指数成分股均有效,特别是在中小盘样本中效果突出,且剔除风格后依旧保持稳定收益表现。
---
3. 图表深度解读
图表1与图表10、13、17 展示的关键因子净值曲线分析
- 图表1和图表13中,反转残差非孤立成交不平衡因子10分组资金曲线呈现持续上升趋势,且最高组与最低组差距显著,表明因子具有强烈的横截面选股能力。
- 图表17显示纯净反转残差因子多空对冲净值波动更小,曲线更平滑,风险控制显著改进。
- 各图中,多空对冲(第10组对冲第1组,红色虚线)净值走势稳定,说明因子信号具备一致方向性,长期盈利能力强。
---
图表2 平安银行逐笔成交片段展示数据细节支撑因子构建
- 显示具体成交时间点、方向标签(B/S),清晰反映主动买卖订单的构成,为构建因子提供基础数据支持。
- 该图表强调了逐笔成交数据的高频时序特性和市场微观行为的捕捉能力。
---
图表3与图表5 成交不平衡与反转残差因子绩效对比
- 图表3展示的整体成交不平衡因子绩效相对较弱,波动和回撤明显。
- 图表5反转残差因子净值曲线更稳定,曲线走势平滑,综合绩效指标也获得较大提升,表明剔除当期涨跌幅影响是提升因子有效性的关键。
---
图表7 孤立与非孤立成交示意图
- 该图直观说明孤立和非孤立成交订单的时间邻域划分原则,为后续因子划分和信息筛选提供理论基础。
---
图表8 非孤立成交占比日内分布
- 指出非孤立订单占比大约维持在70%左右,说明市场大部分时间交易活跃度较高,非孤立订单数据丰富,是挖掘有效选股信号的主要领域。
---
图表11与14 孤立、非孤立及其反转残差因子绩效综合对比
- 图表11显示非孤立成交不平衡因子优于孤立因子和整体因子,进一步证实非孤立订单的重要性。
- 图表14强化了这一结论,反转残差非孤立成交因子表现远超孤立版本和整体版本,尤以IC、收益率以及信息比率指标最为显著。
---
图表16 反转残差非孤立成交因子与市场风格因子相关性低
- 证明该因子所捕捉的选股信息独立于主流风格因子,减小风格依赖风险,增强组合多样性。
---
图表19与图表20 参数敏感性分析图
- 显示邻域参数大小及回看交易日数对因子绩效的灵敏度,提供了因子调参的实证指导。邻域10ms,20日回看为优选。
---
图表21与22 因子在不同指数样本中的表现
- 因子在沪深300等大盘股中依然保持稳定有效,说明其普适性;在中小盘股票池中表现更优,信息比率提升明显。
---
4. 估值分析
本报告不涉及传统财务估值模型,而是通过统计学指标如IC(信息系数)、ICIR(信息系数的年化信息比率)、多空对冲年化收益率和信息比率等量化指标评估因子有效性和选股能力。
- IC(Information Coefficient):因子值与未来收益的相关系数,越高表明因子预测能力越强。
- ICIR(IC Information Ratio):年化IC的均值与波动率比值,评估IC的稳定性。
- 信息比率(IR):多空组合年化收益率与年化波动率比值,反映绩效风险调整后的收益质量。
---
5. 风险因素评估
- 报告明确指出所有结论基于历史数据和测算模型,存在未来市场环境若发生显著变化可能导致模型失效的风险。
- 量价因子通常依赖市场微观结构和交易行为,市场流动性、制度调整、手续费政策等外部因素变动均可能影响因子表现。
- 报告未详细说明缓解策略,但对因子进行风格及行业中性化处理,以及参数敏感性分析属于一定的风险控制手段。
---
6. 批判性视角与细微差别
- 本报告基于丰富交易微观数据展开,数据驱动证据充分,分析逻辑清晰,体现出较高的专业水平。
- 需要注意的是,剔除当期涨跌幅影响的正交处理是提升因子绩效的关键步骤,表明原始因子与行情存在复杂交互,若该关系在特殊市场条件下变化,因子表现可能相应波动。
- 孤立成交因子绩效极弱,表明微观结构时间邻域的定义对因子性能影响较大,后续研究可探索更细粒度的时间窗口或结合订单簿深度信息进一步挖掘。
- 报告的样本区间虽较长(2017-2024),但2024年至8月数据或有局限,实际市场不确定因素依然存在。
- 未提供交易成本考虑和因子组合应用的实证结果,有限制实操推广。
---
7. 结论性综合
本研究系统挖掘逐笔成交微观数据中买卖差异信息,创新性地提出了“孤立”和“非孤立”成交订单的划分方法,并基于此构建了“反转残差非孤立成交不平衡因子”。
核心发现包括:
- 初始成交不平衡因子虽具选股信号但表现有限,主要因其与当期涨跌幅存在正相关,拉低了未来预测能力。
- 通过对因子剔除同期累积涨跌幅的线性影响(正交化),构造出反转残差成交不平衡因子,因子稳健性显著映入指标提升。
- 进一步筛选非孤立成交订单,剔除信息含量较低的孤立成交单,提升了因子有效性和净值稳定度。
- 纯净版本因子剔除市场主流风格因子和行业影响后,信息比率达到3.05,年化收益率稳定在15%以上,最大回撤控制在2.6%左右,风险调整表现优异。
- 参数敏感性测试确认10ms邻域窗口及20日回看窗口为较优设定,提升模型实用性。
- 因子在不同大小盘股票样本均具有选股效果,具备较广泛的适用性。
综上,该报告从市场微观交易行为出发,开发了一种既科学又实用的量价选股因子,表现出强烈的预测能力和稳定的投资价值,适合作为多因子选股策略的有效补充。
---
参考文献与数据来源
- 数据:Wind、通联数据
- 研究机构:国盛证券研究所金融工程团队
- 报告链接:https://pan.baidu.com/s/1pyO4jkOFffGYEnYb7Ycj_g 提取码:sqta
---
重要提醒
本文结论基于历史数据及模型测算,未来市场环境变化可能导致模型失效,投资者应谨慎使用,并结合自身风险偏好做出独立投资判断。[page::0,1,2,3,4,5,6,7,8,9,10,11,12]
---
附录:重要图表(Markdown格式样例)
- 反转残差非孤立成交不平衡因子10分组及多空对冲净值

- 成交不平衡因子10分组及多空对冲净值

- 纯净反转残差非孤立成交不平衡因子10分组及多空对冲净值

---
以上内容对报告进行了全面细致的剖析和解读,涵盖构建逻辑、数据分析、模型改进、效能验证、风险揭示等方面,充分展现了报告的深度和实践价值。