市场微观结构探析系列之二:订单簿上的alpha
创建于 更新于
摘要
本报告基于A股市场高频订单簿数据,构建了用于量化短期股价走势的Spread指标。研究发现不同频率下该指标含义差异显著,Tick级指标预示短期绝对收益,日月频指标则提供截面相对选股alpha信息。月度Spread因子具备稳定选股能力,多空组合年化收益达14.6%,IC胜率75.7%,且独立于常见量价因子,凸显其增量alpha贡献 [page::0][page::4][page::7][page::8][page::9][page::11]。
速读内容
高频与低频Spread指标构建与含义 [page::4][page::6][page::7]
- 高频层面基于订单簿买卖挂单金额加权构建BID和ASK指标,定义Spread_Tick = (BID - ASK)/(BID + ASK),反映盘口买卖压力差异。
- Tick频Spread值越大,短期股价短期上涨概率越大;反之,下跌概率越大。
- 日频Spread指标通过成交量筛选成分进行加权截面标准化,日频显示盘口买单厚度与当日主动买入成交额占比负相关,反映不同频率含义差异。
- 月频Spread通过对日频数据加权平均形成,作为多因子模型alpha因子使用。
高频择时绩效与日内回测分析 [page::5]
| Tick数量 | IC均值 | 空头收益 | 空头胜率 | 多头收益 | 多头胜率 |
|----------|--------|----------|----------|----------|----------|
| 5 | 16.1% | -0.033% | 57.8% | 0.035% | 56.2% |
| 10 | 18.7% | -0.048% | 61.7% | 0.049% | 60.5% |
| 20 | 20.1% | -0.063% | 64.3% | 0.067% | 63.3% |
| 40 | 20.0% | -0.078% | 65.7% | 0.085% | 64.7% |
| 100 | 19.4% | -0.098% | 66.5% | 0.111% | 65.0% |
| 200 | 19.2% | -0.120% | 66.1% | 0.135% | 63.9% |
- 指标IC均值稳定高于15%,多头和空头组合均表现出显著盈利能力,表明具备较强短期择时价值。
- 以000062.SZ为例,日内交易信号触发频繁但交易成本较高,策略需结合多个信号以提升净收益。
月频Spread选股因子构建与回测 [page::7][page::8][page::9]

- 月频因子分组多空组合年化收益17.7%,IR 1.86,IC均值-4.5%,ICIR -1.83,IC胜率71.3%,表现稳定。
- 行业与市值中性化后,多空组合收益仍达14.6%,IR提升至2.01,IC胜率提升至75.7%,稳健性增强。
- 各主要股票池沪深300、中证500、中证800、中证1000中均表现出显著选股能力,特别是中证1000收益20.4%,IC胜率79.3%。
因子增量信息与独立性分析 [page::10][page::11]

| 年份 | 四因子多空收益 | 四因子IR | 四因子IC均值 | 四因子ICIR | 五因子多空收益 | 五因子IR | 五因子IC均值 | 五因子ICIR |
|----------|----------------|---------|--------------|------------|----------------|---------|--------------|------------|
| 全样本 | 39.6% | 3.24 | 10.1% | 4.22 | 40.4% | 3.54 | 10.4% | 4.78 |
- Spread因子与反转、波动率、换手率、流动性等四大量价因子相关性较低,相关系数均值在13.6%到-15.1%之间,具备较高独立性。
- 将Spread因子加入复合因子后,选股能力的多空IR和ICIR均有明显提升,显著增加组合的alpha收益空间。
核心结论总结 [page::0][page::11]
- 高频订单簿信息蕴含显著短期价格预判能力,Tick级Spread指标预测15秒到10分钟的短期收益显著。
- 日频及月频Spread因子揭示了截面上的相对收益规律,表现出良好的选股能力和稳健性。
- 因子在多个主要股票池中均有效,且独立于传统量价因子,贡献边际增量alpha信息,适合纳入多因子选股框架。
深度阅读
金融工程报告《市场微观结构探析系列之二:订单簿上的alpha》详尽分析
---
一、元数据与报告概览
- 报告标题:《市场微观结构探析系列之二:订单簿上的alpha》
- 报告机构:天风证券研究所
- 发布日:2019年9月5日
- 作者:吴先兴(分析师,SAC执业证书编号S1110516120001),缪铃凯(联系人)
- 研究主题:基于高频数据的市场微观结构分析,尤其聚焦于订单簿中盘口信息的解析及其对低频alpha的挖掘。
核心论点与结论: 本报告首次系统地提出并分析了基于订单簿挂单买卖双方力量构造的Spread指标,既证明该指标在极短时间(5~200 Tick)内具有较强的价格预测能力,也发现将该指标低频化后能较好地反映日内与月度的股票相对表现,从而为Alpha因子的挖掘提供新方向。因子稳定、独立性强,能为传统量价因子提供显著增量信息,展现出良好的选股和择时能力,推荐投资者关注该订单簿基因子在多因子模型中的应用价值[page::0,2,4,11]。
---
二、逐章节深度解读
1. 微观结构与高频数据
- 本章节点明了国内券商研究普遍侧重于中低频(日、周、月)数据进行多因子投资,而对盘内高频微观结构、尤其是Level-2订单簿深度数据的研究不足。
- 数据来源为逐笔成交、盘口快照,数据频率最高可以毫秒,主要为研究高频或日内交易信号提供支撑。
- 以平安银行7月1日具体Tick行情数据示例展示了订单簿的深度信息(买卖10档挂单价量),作为后续指标构造的基础数据[page::2]。
2. 时间序列因子与Alpha因子的区分
- 细化了Alpha因子的定义:传统alpha因子反映的是未来一段时间内所有股票的相对强弱(截面角度),时间序列因子则侧重于预测单只股票的绝对收益(时间序列角度)。
- 报告结合二者的数学表达,区分了截面IC(因子值与股票当期收益的相关系数)与时间序列IC(因子值与单只股票不同时段收益的相关系数),并提出了两类高频交易策略:
a) 高频alpha因子构建多空组合作区间超额收益;
b) 高频时间序列因子用于个股择时实现日内高抛低吸。
- 本文重点偏向第二种方法,基于高频数据挖掘时间序列因子,探寻转化为低频alpha的可能[page::3]。
3. 基于订单簿的Spread指标构造与日内预测能力
- 3.1 订单簿介绍: Level-2行情提供买卖两侧各10档价量信息,具体表格展示了某时点平安银行买卖挂单明细,突出盘口买卖力量的层级分布[page::4]。
- 3.2 指标构造细节:
- Spread指标通过加权买卖盘口挂单金额计算,买盘与卖盘金额加权差异定义为:
\[
Spread\Tick = \frac{BID - ASK}{BID + ASK}
\]
权重\($wi = 1 - \frac{i-1}{10}$\)强调买卖盘口靠前档位的权重。
- 该指标代表短期买卖需求相对强弱,指标值大表明买盘厚,价格短期上升概率更大,反之亦然。
- 3.2 指标短期预测能力验证:
- 在中证500成分股上,沿不同Tick预测窗口(5到200 Tick)评估Spread与未来收益相关性,IC均值保持在15%-20%区间,多头组合平均正收益0.035%~0.135%,空头组合平均负收益同幅度,对应胜率均超55%~66%,显示该指标对日内短期股价走势具有较强预测力。
- 以股票000062.SZ为例,日收益累计明显表现出该指标策略的有效性,但受制于日内高换手带来的手续费成本,真实盈利空间有一定压缩[page::5]。
4. Spread指标的降频特征与低频Alpha提炼
- 3.3 高频指标低频化及日内不同频率含义
- Spread指标从Tick频率降频至日频时,指标含义发生显著变换。
- 高频(Tick)层面,盘口买盘越厚对应绝对收益率越高,表现为正相关;而日频层面,盘口买盘越厚的股票实际上当日承受的主动卖压力越强,导致截面上的相对收益越低,表现为负相关。
- 这一逻辑基于涨停与跌停盘口挂单极端情况的市场结构解释,说明Spread指标具有频率依赖性,分辨因子应用的频率场景至关重要。
- 日频指标计算通过成交量筛选(保留半数成交额较低的Tick快照)剔除成交打薄效应,并使用截面标准化剥离市场整体走势干扰[page::6,7]。
- 4.1 月频因子构造方法:
- 日频标准化后,Spread按交易日加权算术平均降频至月度,以时间权重促进最新数据重要性,形成多因子模型可用的月度Alpha因子[page::7]。
- 4.2 因子历史绩效展示:
- 2010年至2019年8月,Spread月度原始因子10分组多空组合年化收益17.7%,表现稳健。
- 该因子IC均值约-4.5%,IC胜率为71.3%,显示该指标对截面未来收益的有效负相关预测。
- 经行业与市值中性化后,因子表现依旧稳健,多空年化收益14.6%,IC均值-4.0%,IC胜率提升至75.7%,ICIR达到-2.10,呈现更加平滑的收益与IC曲线,强化因子稳健性[page::8,9]。
- 4.3 各主要指数成分股的分域绩效对比:
- 因子在沪深300、中证500、中证800及中证1000各指数成分股范围内均显示显著选股能力,IC均值均超过4%,尤其在中证1000表现最为突出。
- 多空收益净值曲线持续上升,显示因子稳健适用不同市值规模与行业分布的股票池,适用范围广泛[page::9,10]。
- 4.4 因子增量信息分析:
- Spread因子与传统月度量价指标(20日反转、波动率、换手、非流动性冲击)相关性较低,体现较好独立性。
- 加入Spread因子后的五因子组合相比传统四因子模型明显提升多空IR和ICIR,因子整体选股能力提升,证明Spread因子贡献了实质的增量alpha[page::10,11]。
5. 综合总结
- 报告回顾并强化了基于紧密的盘口订单簿信息构造的Spread指标作为独立Alpha源的有效性。
- 高频Tick级的Spread指标能预示极短期股价走势,而其低频化衍生的月度Alpha因子表现稳定,年化收益约在14.6%,潜力与传统量价因子很好互补。
- 订单簿中盘口买卖压力的复杂关系及指标的频率依赖性,是从事量化交易模型设计者必须充分理解的重点。
- 因子在不同股票池中的表现一致,且提供明显增量信息,表明该因子具备较强研究和实战意义[page::0,11]。
---
三、图表深度解读
- 图1(第2页)- 平安银行20190701盘口行情快照示例:
展示Level-2盘口中买卖双方10档深度的价格与挂单数量,数据每3秒更新一次。该原始数据是Spread指标构建的基础,体现盘口的即时买卖力量分布。
- 图2(第3页)- Alpha因子与时间序列因子示意图:
直观区分了两类因子信息流向:Alpha因子反映全市场股票相对排序,时间序列因子反映单只股票涨跌强度,支持报告中对因子概念的阐述。
- 表2(第5页)- Spread指标Tick级预测绩效:
展示5至200个Tick的IC均值均超过15%,多头与空头收益与胜率分布均良好,强化Spread指标在日内短期预测的有效性。
- 图3(第5页)- 000062.SZ日内收益累计曲线:
以某股票为例,通过基于Spread指标构建的日内择时策略累计收益曲线,显示日内操作潜力,但以交易成本消耗多空收益为代价。
- 图4(第6页)- Spread与日内主动买入比例(BuyRate)相关系数时序:
以20日滚动均值表现二者负相关关系,反映在日频层面上买盘相对厚实度反映股票被动卖出压力增强的市场现象。
- 图5、图7 & 图6、图8(第8页)- Spread指标分组收益与IC序列对比(原始值与中性化后):
在中性化剔除行业和市值影响后,因子分组收益仍明显,大幅超越基准,且IC序列波动减小,稳定性提升。
- 图9(第9页)- 不同股票池Spread因子多空净值曲线:
各指数成分股多空净值持续攀升,说明因子在不同规模和行业股票中均展现了很好的收益连续性和风险控制。
- 图10(第10页)- Spread因子与其他量价因子相关性对比:
相关性系数波动在-20%至+20%之间,说明Spread因子提供了针对盘口买卖压力的新颖信息,不被现有因子覆盖。
- 表7(第10页)- 融合实验中Spread因子增量信息验证:
加入Spread因子提升了复合因子的多空收益、IR与IC指标,验证其在多因子选股组合中的增量贡献。
---
四、估值分析
本报告主要关注因子构建与绩效评估,未涉及具体上市公司估值模型,因此无DCF、市盈率等估值方法的分析内容。
---
五、风险因素评估
- 因子失效风险:交易逻辑被市场识别后可能导致因子套利空间缩小。
- 模型失效风险:因子构造方法、参数选择或数据异常等可能影响模型稳定性。
- 市场风格变动风险:不同市场环境下因子表现可能截然不同,尤其在行情剧烈变动或高频交易限制加强时[page::0]。
报告对风险提示简洁明确,未具体展开缓解方案,投资者需结合自身持仓灵活调整。
---
六、批判性视角与细微差别
- 频率差异导致指标含义反转: 报告指出Tick级与日频的Spread指标方向相反,这揭示了选股因子构建中频率尺度选择对策略适用性至关重要。该频率敏感性需投资者特别关注。
- 交易成本未充分量化: 虽然报告提及日内高频策略面临较大交易成本,但对成本敏感性缺少详细量化分析,实际应用该因子时仍需慎重调研和实盘测试。
- 负向相关的因子IC: 因子IC呈负值,说明因子与未来收益负相关,这在实务投资中需要投资者反向构建组合或做空策略,这一点在策略实现上需额外关注。
- 数据选择偏差风险: 将Tick成交量较低的一半截面作为日频指标计算依据,有助于剔除成交冲击,但也可能产生选样偏差,对此未有深入探讨。
---
七、结论性综合
本报告通过对A股市场Level-2订单簿的深入剖析,提出一项基于盘口买卖挂单金额差异的高频指标——Spread。他实证了该指标在微观Tick数据层面对股价极短期走势的预测力强,且在低频化成月度alpha因子后,同样具备良好且稳定的截面选股能力,能够为量价因子模型提供有力的增量信息。
具体来看,Tick层面Spread指标与未来5至200 Tick收益的IC均保持15%~20%,且多头和空头组合均获得平均正负收益和较高胜率,显著支持其作为短线择时信号的效用。同时,研究也发现指标在降频至日频时其含义逆转,即盘口买盘厚实反映出日内和盘压力,体现因子对不同频率的适用性需差异化理解。进一步通过降频加权平均,构建了适合多因子选股模型的月度Spread因子,综合业绩数据表明该因子在2010年至今表现稳定,中性化调整后年化多空收益14.6%,IR达2.01,IC胜率超75%,表明因子具备相当的实用价值。
此外,该因子在沪深300、中证500、800与1000等不同规模和风格的股票池中均表现良好,显示其广泛适用性。与传统量价因子相关性低,且为多因子复合模型贡献了显著的增量alpha,进一步提高复合策略的表现。此外,对于因子的理性理解还需关注其交易成本影响和策略频率匹配,以避免实际应用中因未充分考虑因素导致的性能衰减。
总体而言,本报告从市场微观结构视角,创新性地利用高频订单簿数据开辟了多因子选股的新路径,为量化投资者提供了一条结合高频微观交易信号与低频多因子框架的融合思路,在加强择时能力与捕获增量alpha方面具备良好前景。报告严谨详实,数据充实,图表清晰,值得投资研究人员深入研读并充分借鉴。
---
参考溯源标示
以上分析均基于提供内容,引用页码标识如文中所示,范围涵盖第0至11页主要正文部分,图片欧标及表格数据均得到全面解析[page::0-11]。