`

买卖压力失衡——利用高频数据拓展盘口数据

创建于 更新于

摘要

本报告提出利用高频tick数据,通过价格波动探测个股买卖挂单信息,构建扩展盘口数据,进而计算买卖压力。研究发现买卖压力失衡能显著预测个股短期超额收益,买压占优带来正向超额收益,卖压占优带来负向超额收益,且超额收益在压力失衡消失后出现反向修正。基于买卖压力失衡构建事件驱动策略,实现年化19.66%收益,表明高频数据在低频选股策略中的有效应用价值 [page::0][page::2][page::4][page::5][page::6][page::7][page::9][page::10][page::11]

速读内容


高频数据降频思路,扩展日内盘口数据 [page::2][page::3][page::4]

  • 传统Level1盘口数据仅含买卖五档,信息有限。

- 通过串联tick高频成交价上下波动,构建超过五档的扩展盘口数据,增强低频信号的信息含量。
  • 利用价格为“探针”,追踪不同价位挂单量,获取长尾盘口挂单序列。




买卖压力计算方法与买卖压力失衡定义 [page::4][page::5][page::6]

  • 买卖压力权重赋予距离收盘价越近挂单越大影响权重。

- 买卖压力比定义为买盘压力与卖盘压力对数差的差值。
  • 用中证500成分股,收盘前1h tick数据计算买卖压力,界定压力失衡阈值±1.96倍历史标准差。

- 买压占优与卖压占优分别对应买卖压力显著偏离历史均值上下界。




买卖压力失衡事件驱动超额收益显著 [page::7]

  • 买压占优个股短期内呈现明显正向超额收益。

- 卖压占优个股短期内呈现明显负向超额收益。
  • 压力失衡消失后价格超额收益有反向修正趋势。




当日涨跌幅对买压占优超额收益影响分析 [page::8]

  • 当日股价下跌情况下买压占优,后续6-7日产生显著超额收益。

- 当日上涨时买压占优追涨可能性大,超额收益弱。
  • 震荡日买压占优影响有限。




事件驱动策略构建与回测表现 [page::9][page::10]

  • 选取当日下跌时买压占优个股建仓,持有10交易日。

- 持仓通道10、20、30组合均衡测试,10通道策略表现最佳。
  • 10通道年化收益19.66%,超额收益9.56%,16、17年收益分别9.07%、6.68%。






| 年份 | 年化收益率(10通道) | 夏普比率 | 最大回撤 | 月度胜率 | 年化超额收益率 | 信息比率 | 相对回撤 | 月度胜率(超额) |
|--------|---------------------|----------|----------|----------|----------------|----------|----------|----------------|
| 2010 | 37.14% | 1.2118 | -12.81% | 72.73% | 17.58% | 0.4033 | -19.92% | 54.55% |
| 2011 | -18.25% | -0.8643 | -29.51% | 33.33% | 14.06% | 0.3457 | -10.30% | 58.33% |
| 2012 | 26.36% | 0.8574 | -15.76% | 50.00% | 14.98% | 0.3504 | -13.07% | 50.00% |
| 2013 | 2.97% | -0.0011 | -17.18% | 58.33% | -15.82% | -0.6168 | -20.37% | 50.00% |
| 2014 | 51.18% | 2.0615 | -8.39% | 75.00% | 7.03% | 0.1420 | -12.45% | 50.00% |
| 2015 | 56.50% | 0.9633 | -31.55% | 58.33% | 20.02% | 0.2629 | -24.43% | 50.00% |
| 2016 | 9.07% | 0.2071 | -20.17% | 58.33% | 4.24% | 0.0308 | -14.99% | 66.67% |
| 2017 | 21.70% | 0.9336 | -6.58% | 75.00% | 33.15% | 1.3884 | -5.61% | 75.00% |
  • 策略风险较高,因买卖压力稳定性尚待提升,[page::10]


结论与未来展望 [page::11]

  • 高频tick数据整合处理可大幅提升盘口信息维度。

- 买卖压力失衡对个股短期价格走势有强关联,短期异动具备策略开发价值。
  • 拟进一步基于买卖压力研究选股与择时策略,拓展高频数据应用范围。


深度阅读

金融工程买卖压力失衡专题报告详尽解析



---

一、元数据与概览


  • 报告标题:《买卖压力失衡——利用高频数据拓展盘口数据》

- 作者:吴先兴 分析师,SAC执业证书编号:S1110516120001
  • 发布机构:天风证券研究所

- 发布日期:2017年8月1日
  • 研究主题:基于高频tick数据分析个股买卖盘口挂单,定义买卖压力,挖掘买卖压力失衡与超额收益的关系,进而构建事件驱动策略实现选股收益提升。


核心论点与目标信息
报告围绕如何运用高频数据中的盘口挂单信息,尤其是通过收盘前1小时的tick数据构建扩展的盘口数据,定义买卖压力指标,研究买卖压力的失衡如何影响个股短期超额收益。结果表明,买盘压力优势(买压占优)常伴随个股短期正向超额收益,卖压占优则对应负向超额收益,但均为短期冲击性的效果,随后股价出现反向修正。基于这一规律,报告还设计了相应的选股策略,取得了19.66%的年度绝对收益,尤其2016、2017年表现突出。报告旨在为量化选股和事件驱动策略提供基于盘口高频数据分析的理论和实证支持。

---

二、逐章深度解读



2.1 高频数据到低频策略转化



报告首先阐述了高频数据在股票市场应用的普遍难点 —— 高频数据通常用于高频交易,而直接指导低频投资决策意义有限。为解决这一矛盾,提出两种“降频”思路:
  1. 定性加工降频:依据高频数据推断买卖方向,量化积极/保守买入量转化为低频信号,用以衡量投资者情绪变化,辅助选股。

2. 路径信息汇总降频:利用日内股价波动的Tick数据,作为探针挖掘日内盘口挂单信息,构建信息含量更丰富的盘口全景图。

此处理论基础是:高频tick数据中隐藏的盘口挂单信息是被传统日频level1数据所忽略的,合理整合这些信息可以大幅度提升策略洞察力。然而,获得这类数据和开发稳定的应用模型难度大,报告对此予以了客观说明。[page::2]

2.2 挂单与筹码分布



盘口的买卖挂单体现了交易参与者的价格预期和交易意愿。报告强调:
  • 买盘挂单多说明股价下方支撑强,买入意愿旺盛。

- 卖盘挂单多预示股价上方压力大,抛售意愿旺盛。

图1(盘口示例)展示了收盘时买卖五档挂单情况,提示了盘口数据的即时性和有限宽度(仅五档)。这为后续通过叠加高频tick数据获取更长盘口数据铺垫了实践基础。[page::2]

2.3 高频盘口数据的作用与获取



传统的level1盘口数据每时每刻仅能获得五档买卖挂单,信息有限。报告指出:
  • 由于日内股价波动,且每条tick成交价可能不同,叠加时间序列的盘口数据可以突破五档限制,构建包含更多档位的盘口数据集合。

- tick数据由交易所多台服务器推送,时间间隔不固定且数据完整性因源头不同而异。报告选用天软提供的tick数据作为数据源。
  • 表1呈现了tick数据时间、成交量、买卖五档价格挂单等信息样例,展示了数据的高频、细节和多维属性。


这种基于多时刻tick盘口数据累积而成的盘口数据,被称作“更高频的盘口”,是报告数据提取方案的技术核心。[page::3]

2.4 以股价作为高频“探针”挖掘盘口挂单



报告阐述以日内成交价上下波动为锚,推测对应价位上的挂单量,完成买卖挂单序列的路径还原:
  • 图2(挂单序列示例)视觉化了一个时间段内不同价格的买卖挂单累积变化,最终在某一时刻得到22档盘口数据,远超单一时间点五档限制。

- 尽管无法保证最后数据完全真实(因投资者撤单等因素),但其代表价格区间上投资者曾预期的筹码分布,有助于形成立体的买卖筹码结构认知。

基于此,报告提出对不同挂单档位加权以计算买卖压力指标:
  • 权重$W_i$设计基于收盘价与挂单价格差距,越接近收盘价,权重越大。体现了距离收盘价的价格档位对价格影响的递减关系。

- 买压$Pbuy$与卖压$Psell$计算为各档挂单量乘以权重的加权平均。

买卖压力比$P = \log(Pbuy) - \log(Psell)$则用于反映买卖压力的相对大小。[page::4,5]

2.5 买卖压力失衡与超额收益关联研究



数据来源及处理


  • 研究样本为中证500指数成分股,利用2010年以来的tick数据,主要聚焦收盘前一小时的数据以保证性质稳定且降低计算复杂度。

- 如表2所示,对个股单日收盘前1小时挂单数据进行汇总,获得高精度的多档挂单分布。

买卖压力分布和失衡界定


  • 基于过去20个交易日买卖压力的均值和标准差,设置上下1.96倍标准差界限识别“买压占优”(买卖压力比向上突破)与“卖压占优”(向下突破)状态。

- 图3显示某典型个股买卖压力比的分布近似正态,图4描绘买卖压力的动态变化和失衡期间与收盘价的关系。

超额收益测算框架


  • 事件驱动评估系统:事件为买卖压力失衡触发

- 选取事件后第一个非涨停开盘日为事件起点
  • 计算该事件股份相对中信一级行业收益的超额收益,剔除ST股等高风险股

- 用相同行业、相近市值5家公司作为对照组,计算累积超额收益

图5显示:买压占优对应短期正超额收益,卖压占优对应短期负超额收益,但随后均呈反转修正,表明买卖压力失衡的价格冲击效应具有短暂性。[page::6,7]

2.6 当日股价涨跌对买压占优超额收益的影响


  • 根据当日股价涨跌幅划分“上涨(>2%)”、“震荡(-2%~2%)”和“下跌(<-2%)”三种状态

- 图6显示下跌后出现买压占优时,后续6~7日显著产生正向超额收益;当日上涨时出现买压占优,则呈“追涨”态势,未来超额收益有限;震荡时效应居中。

此分析强调了事件发生当日环境的重要调节作用,为选股时增加更精细的过滤维度提供了依据。[page::8]

2.7 事件驱动策略构建与历史回测



基于买压占优且当日股价下跌的条件构建买入信号,持有10个交易日,考察不同策略仓位峰值(10、20、30通道组合)表现。
  • 图7-9展示了不同通道组合的策略净值与仓位变化。

- 表10为收益、夏普比率、最大回撤及月度胜率的年度统计,揭示策略在多年周期内的稳健性和绩效。
  • 结果显示,10通道组合表现最佳,年化绝对收益19.66%,超额收益约9.56%,2016-2017年表现尤其出色(9.07%、6.68%),但由于持仓数量较小,策略波动性也相对较大。


报告指出,由于买卖压力的稳定性不足,策略因事件驱动而带来的风险较高,需谨慎管理。[page::9,10]

---

三、图表深度解读



图1(盘口示例,页2)


  • 展示买卖五档挂单价及对应挂单量(黄色数字),具体价位及挂单量揭示当前收盘价附近的买卖筹码分布状态。

- 通过单一时间点盘口观察,信息受限于5档深度;有助于说明盘口局限,启发后文“更高频盘口”理念。

表1(tick数据示例,页3)


  • 提供多条时间戳对应的成交价、成交笔数、买卖五档挂单价格及挂单量数据。

- 明确tick数据的动态变化与实时性,是扩展盘口数据的基础。

图2(挂单序列示例,页4)


  • 以颜色区分的买卖挂单量矩阵,以时间为横轴,价格为纵轴,显示挂单的动态累积形态。

- 右侧汇总柱状表示该时间的总挂单分布,超过Level1五档范围,显著提升盘口层次信息。

表2(汇总挂单示例,页5)


  • 汇总个股收盘前1小时挂单及成交情况,包括成交笔数、成交额、成交量、买卖方向、档位、挂单价格和挂单量。

- 说明用大样本tick数据叠加汇总复合出较完整盘口信息的方法学细节。

图3(买卖压力分布图,页6)


  • 直方图及拟合曲线揭示单一股票买卖压力比的统计分布,近似正态分布,表明压力波动有合理的统计模型基础。


图4(买卖压力波动,页6)


  • 时间序列图描绘买卖压力比与收盘价的关系,黄色阴影带表示两倍标准差阈限,买压与卖压占优的判定明确,展示压力比与股价的同步波动。


图5(买压卖压占优超额收益,页7)


  • 折线图展示买压占优(蓝线)期间的正向累积超额收益,卖压占优期间(橙线)则表现为负向超额收益,均在事件后10个交易日内出现反向修正趋势。


图6(当日涨跌对买压占优超额收益影响,页8)


  • 三条折线分别表现当日上涨、震荡与下跌时买压占优的超额收益差异。

- 明显看出当日下跌后买压占优带来最强的正向超额收益,验证事件环境对策略有效性的影响。

图7-9(策略净值与仓位,页9-10)


  • 三个位数不同的通道组合策略净值走势,策略净值线(红)通常优于基准(蓝),策略持仓幅度用橙色棒图表示。

- 策略净值整体呈上升趋势,说明事件驱动策略整体盈利。

表10(收益率分年统计,页10)


  • 精细统计每年年化收益率、夏普比率、最大回撤、月度胜率等,确认策略稳健性与盈利能力。

- 注意2016年回撤较大,显示一定的阶段性风险。

---

四、估值与策略评价



报告未直接涵盖传统估值方法(如DCF、市盈率等),而是聚焦于事件驱动量化策略的绩效评估,使用超额收益、夏普比率和最大回撤等指标全面反映策略表现。
  • 超额收益基于与同业市值相近公司比较,剔除市场系统性风险,提高策略alpha识别度。

- 持仓通道不同影响风险分散和净值曲线平滑性,10通道效果最好,但单笔投资集中度也最高,风险最高。

---

五、风险因素评估



报告识别的主要风险包括:
  1. 买卖压力稳定性不足:买卖压力失衡虽能提供短期冲击信息,但失衡消失后超额收益反向,表明信息仅限短期。

2. 盘口挂单的真实性假设有限:投资者可能撤单,汇总的挂单信息不完全反映真实挂单库存,存在误差。
  1. 市场极端情绪影响:涨停股和小盘股等特殊事件可能导致测算偏差。

4. 策略回撤风险:尤其在2016年显示极端回撤,风险敞口不可忽视。

报告未详述缓解策略,建议未来结合波动率监控和资金管理进行补充。

---

六、批判性视角与细微差别


  • 本文对高频tick数据的累积整合方法独具创新,但依赖于tick数据的完整性与质量,数据源的差异(不同服务商)可能影响实际应用效果,风险提示不足。

- 买卖压力权重的函数形式基于价格差异倒数加权,合理但未见对其他权重设计的对比或优劣讨论,存在模型假设单一的问题。
  • 关于超额收益的反转,策略的短期收益机理未深入探讨根本驱动因素,后续可结合行为金融理论进行完善。

- 策略持仓规模与收益波动关联较大,未提供风险调整后最优持仓尺寸的敏感度分析。
  • 对于行业异质性、极端行情的适应性分析有限,部分年分策略表现疲软未详细解读。


---

七、结论性综合



本报告通过创新地利用股票市场高频tick数据,拓展低频盘口挂单信息的深度,有效构建了衡量买卖压力的指标体系。报告显示:
  • 通过成交价上下波动,将每日tick盘口挂单数据汇总为超过传统5档盘口的多档盘口,提升信息含量。

- 制定买卖压力加权指标,有效捕捉买压卖压失衡状态。
  • 通过对中证500样本数据的严谨统计分析,证实买卖压力失衡具有显著的短期超额收益预测能力:买压占优对应正超额收益,卖压占优对应负超额收益,且该效应为短期冲击,之后产生逆转。

- 投资者当日跌价后买压出现占优时,策略效果最佳。
  • 设计基于买压占优且当日下跌的事件驱动选股策略,10通道组合在2010年至2017年间获得年化19.66%绝对收益及显著超额收益,尤其2016、2017年表现亮眼。

- 策略面临买卖压力信号稳定性和撤单行为带来的风险,且存在较大的回撤风险,应用时需结合风险控制。

此项研究开辟了高频数据向低频量化策略转换的新路径,具备重要的理论价值和实践意义,为量化选股策略的深化提供了科学工具和方法论基础。

---

参考图表索引


  • 图1 盘口示例

- 表1 tick数据示例
  • 图2 挂单序列示例

- 表2 汇总挂单示例
  • 图3 买卖压力分布图

- 图4 买卖压力图
  • 图5 买压卖压占优超额收益

- 图6 当日涨跌对买压占优超额收益影响
  • 图7 策略净值与仓位(10通道)

- 图8 策略净值与仓位(20通道)
  • 图9 策略净值与仓位(30通道)


---

综上所述,报告精细地分析了如何利用高频盘口数据构建买卖压力指标,验证了买卖压力失衡对个股短期超额收益的显著影响,并成功设计出基于该指标的事件驱动选股策略,取得良好收益表现。[page::0,2,4,5,6,7,8,9,10,11]

报告