高频订单失衡及价差因子:——因子深度研究系列
创建于 更新于
摘要
本文基于高频盘口数据,构建了两类共14个高频量价选股因子,包括逐档订单失衡率(SOIR)和中间价变化率(MPC)因子,经过转化为月频因子后在单因子回测中表现优异。其中,MPC5_neut因子年化多空收益达30.63%,夏普比率2.88,表现极为突出。因子表现存在高频与低频反向现象,反映了短期资金行为和主力操纵影响。[page::0][page::15][page::16][page::20]
速读内容
高频订单失衡及价差因子构建与定义 [page::3][page::5]
- SOIR因子通过加权逐档订单失衡率反映不同盘口档位买卖委托的力量差异,权重向靠近交易价格的档位倾斜,短期内买卖盘失衡可预示价格走势。
- MPC因子基于中间价(买一卖一均价)短期百分比变化率,捕捉市场交易者对未来价格的预期,高频MPC1显示动量效应,MPC5及极值和偏度因子揭示价格极端变动信息。
高频到低频因子转换方法及IC反转现象 [page::7][page::8][page::9]
- 高频分钟因子标准化后转化为日频,再加权为月频因子,考虑近期数据权重更大,提升信息时效性。
- 高频SOIR因子IC为正,且档位靠前IC值较高;但转为月频后均呈负相关,MPC1高频正相关,低频转负,反映短期动量与长期均值回归及主力短线操纵带来的反转。
因子与常用选股因子相关性分析 [page::9][page::10]
- SOIR类因子与估值、动量等因子相关较高,MPC类因子与动量反转和技术因子相关明显,但整体与市值相关弱,显示较好独立性。
各因子单因子回测结果及表现对比 [page::10-18]
- SOIR因子整体表现良好,随着档位上升,IC均值约-4%至-5.37%,年化多空收益率从8.63%提升至21.32%,夏普比率最高达2.41。
- MPC因子低频表现尤为突出,特别是中性化后的MPC5neut,IC均值-7.26%,年化多空收益30.63%,夏普比率 2.88,罕见的量价类因子表现。
- 其他MPC衍生因子如MPC1

因子在中证500与沪深300样本中的稳定性测试 [page::18-19]
| 因子 | 中证500年化收益% | 沪深300年化收益% | 夏普比率(中证500) | 夏普比率(沪深300) |
|------------|------------------|------------------|---------------------|---------------------|
| SOIR3 | 11.37 | 10.26 | 1.16 | 1.25 |
| SOIR4 | 14.86 | 8.47 | 1.57 | 0.95 |
| SOIR5 | 14.07 | 9.32 | 1.64 | 0.89 |
| MPC1neut | 15.37 | 9.45 | 1.26 | 0.82 |
| MPC5neut | 17.68 | 10.75 | 1.51 | 1.28 |
| MPC5skew | 15.89 | 12.35 | 1.72 | 1.94 |
- 因子在主流指数样本中均保持较好收益和风险表现,显示较强的稳定性和广泛的适用性。
总结与风险提示 [page::20]
- 高频盘口数据蕴含大量交易情绪和知情交易信息,本文设计的SOIR与MPC因子从高频量测到低频选股,回测表现优异,是有价值的量价选股工具。
- 高频因子与低频因子表现反转揭示了市场的短期冲击与长期均值回归机制,研究对量化投资者因子挖掘与策略设计有重要启示。
- 注意模型基于历史数据,未来依旧可能发生失效风险,需结合市场环境动态调整策略。
深度阅读
金融工程深度报告:《高频订单失衡及价差因子——因子深度研究系列》详尽分析
---
一、元数据与报告概览
- 报告标题:高频订单失衡及价差因子——因子深度研究系列
- 作者:陈升锐(中信建投证券金融工程团队,资深量化选股研究员)、丁鲁明(金融工程总经理)
- 发布机构:中信建投证券股份有限公司
- 发布日期:2021年1月29日
- 研究主题:基于高频盘口数据,构造逐档订单失衡率(SOIR)和中间价变化率(MPC)两大类共14个高频量价因子,并通过降频处理形成低频选股因子,进行理论研究和实证回测。
核心论点
- 利用高频盘口完整数据构建了逐档订单失衡率和中间价变化率因子,能够有效捕捉市场交易者买卖压力与价格动向。
- 高频中SOIR类因子与收益率呈正相关,但降为低频后因子表现出现逻辑反转,导致低频因子与收益率负相关。
- MPC类因子(特别是MPC5neut)表现突出,IC均值达到-7.26%,年化多空收益超过30%,夏普比率高达2.88,为罕见的量价选股因子优异表现。
- 该系列因子在中证500和沪深300样本均表现稳健,具有良好的广泛适用性。
---
二、逐节深度解读
1. 高频订单失衡及价差因子定义和投资逻辑
1.1 研究引言
- 盘口数据包括买卖挂单价格和数量,反映短期市场供需和交易者情绪。
- 传统研究多关注买一档和卖一档,本文拓展到5档盘口,提高信息覆盖度。
- 通过各档盘口委托量构造订单失衡率因子(SOIR),以反映多空力量对比。
- 中间价变化率因子(MPC)反映买卖双方对价格波动的预期,含均值、最大值(极端波动)、偏度(分布不对称)维度。
1.2 逐档订单失衡率(SOIR)定义及逻辑
- 每档订单失衡率SOIRi计算为第i档买盘与卖盘挂单量差值占总挂单量的比例:
\[
SOIR{i,t} = \frac{V{i,t}^B - V{i,t}^A}{V{i,t}^B + V{i,t}^A}
\]
- 综合因子SOIR为加权平均,权重随档位递减(买卖第一档权重最高)。权重减衰公式:
\[
wi = 1 - \frac{i-1}{5}
\]
- SOIR为正表示买压较大,后续价格涨幅概率较高。此改进避免了因一档委托量过大造成的比率失真。
- 盘口中委托量体现投资者对未来走势预期,因而该因子可作为短期买入信号依据。
1.3 中间价变化率(MPC)定义及逻辑
- 计算市场买一价和卖一价的均值为市场中间价:
\[
Mt = \frac{Pt^B + Pt^A}{2}
\]
- MPC因子为k分钟内的中间价百分比变化:
\[
MPC{t,k} = \frac{Mt - M{t-k}}{M{t-k}}
\]
- 典型k选1分钟、5分钟,对应短期价格动量和短期反转不同表现。
- 价差极端值(最大值MPCmax)和偏度(MPCskew)反映了主力“对倒”等异常买卖行为带来的价格操纵,长期价格多呈反转下跌趋势。
---
2. 高频转低频的方法和逻辑
- 对高频分钟因子先进行横截面标准化,剔除大盘影响,保持因子独立性。
- 分别将分钟因子平均至日因子,日因子再按离月末交易日远近加权(近者权重大),使最终获得低频(月度)选股因子。
- 高频和低频的因子IC均值比较显示,高频SOIR因子与收益率正相关,档位越近交易价关联越强;降频后SOIR及MPC因子均出现反向相关,体现出短期动量与长期反转的市场本质差异。
---
3. 高频订单失衡及价差因子与常用因子的相关性分析
- 14个高频因子与常用价值、成长、动量、交易特征因子分析:
- 几乎与流通市值无显著相关,意味着无需做市值中性化处理。
- SOIR因子与估值类因子(BPLR、SPTTM)及动量类因子(Momentum6m、12m)相关性较高。
- MPC因子与动量(3m、6m)及部分技术因子高度相关。
- MPC的极端值和偏度因子与常用因子相关性较弱,显示其有独立选股信息。
---
4. 高频订单失衡及价差因子测试结果(单因子表现)
4.1-4.6 SOIR系列因子详解
| 因子 | IC均值(%) | 年化 IR | 年化多空收益(%) | 夏普比率 | 胜率(%) | 总结 |
|-------|-------------|---------|-------------------|----------|-----------|--------------------------------|
| SOIR1 | -2.68 | -0.94 | 8.63 | 0.88 | 62.7 | 选股效果一般 |
| SOIR2 | -4.18 | -1.27 | 17.89 | 1.52 | 70.63 | 效果明显提升 |
| SOIR3 | -4.86 | -1.63 | 20.46 | 1.94 | 73.02 | 进一步提升,稳定性好 |
| SOIR4 | -5.13 | -1.95 | 21.81 | 2.28 | 77.78 | 表现优异,夏普高 |
| SOIR5 | -5.37 | -2.29 | 21.32 | 2.41 | 78.57 | 表现与SOIR4接近,波动更小 |
| SOIR | -4.57 | -1.53 | 18.11 | 1.70 | 70.63 | 加权整合因子表现略低于高档位 |
- 由此可见,档位越高(远离买卖第一档)的SOIR因子,反而表现更优,包括收益性和风险调整后表现,更建议关注SOIR3-5档及其加权组合。
4.7-4.12 MPC系列因子详解
| 因子 | IC均值(%) | 年化 IR | 年化多空收益(%) | 夏普比率 | 胜率(%) | 备注 |
|--------------|-------------|---------|-------------------|----------|-----------|--------------------------------|
| MPC1 | -5.36 | -1.54 | 19.52 | 1.42 | 70.63 | 基础短期均值因子 |
| MPC1neut | -6.81 | -2.87 | 26.99 | 2.66 | 78.57 | 市值及行业中性化,大幅提升效力 |
| MPC5 | -5.83 | -1.70 | 22.36 | 1.61 | 73.02 | 较长周期均值 |
| MPC5neut | -7.26 | -3.09 | 30.63 | 2.88 | 81.75 | 选股效果最佳,极具实用价值 |
| MPC1max | -8.10 | -2.97 | 20.02 | 1.68 | 73.81 | 极端值因子 |
| MPC1skew | -5.45 | -4.08 | 15.32 | 2.89 | 83.33 | 偏度因子 |
| MPC5max | -9.39 | -3.28 | 24.01 | 1.94 | 76.19 | 极端值因子 |
| MPC5skew | -6.66 | -4.18 | 20.67 | 3.07 | 84.13 | 偏度因子 |
- MPC类因子整体表现强于SOIR类,尤其是中性化后的MPC5neut,年化多空收益超过30%,夏普比率极高,风险调整后收益表现优异。
- 极端值与偏度指标虽收益略低,但夏普较高,风险控制较好,适合稳健投资。
- MPC因子的中性化处理(剔除市值和行业影响)显著提升了因子的效力。
---
5. 因子在不同样本池的表现对比
中证500
- 几乎所有因子年化收益均超过10%,部分因子超过15%。
- MPC5及MPC5neut因子表现突出,年化收益接近18%。
- 最大回撤较低,多空胜率均超过60%,风险调整收益良好。
沪深300
- 因子收益水平略低,年化收益接近或略超过10%。
- MPC5skew因子表现最好,年化收益12.35%,夏普比率也达相对较高。
- 几乎所有因子在沪深300也展现出稳定的选股有效性,表明适用广泛性。
---
三、图表深度解读
报告中诸多图表辅助说明关键因子计算和效果:
- 图1-2 展示SOIR因子的即时计算及其对股票A价格的短期正向影响。例如2020年7月1日9:57股票A SOIR因子达到0.64,下一分钟涨幅3.57%,随后触及涨停,直观反映SOIR短线行情信号的有效性。
- 图3-5 说明MPC1分钟因子如何通过盘口及成交量突增反映买方力量,导致股票B下一分钟收益2.75%上涨。
- 图6 典型演示MPC1因子的低频反转效应,某日14:30 MPC1冲击至6.09%高点后,价格在随后出现显著回撤,体现主力“对倒”行为的长期负向影响。
- 表1、表2 对比高频IC与月频IC,揭示SOIR与MPC因子在不同频率上信用力及因子表现的方向反转现象。
- 各因子收益图(图7-20) 逐个展示因子回测累计收益曲线及其稳定增长态势,配合表格的IC、IR、夏普、最大回撤等统计指标,确认因子量化的有效性。
- 表3 展示因子与传统财务及技术因子的关系,支持选择时的因子去相关性分析。
- 表4、表5 量化了因子在中证500和沪深300不同样本池的可复制性和表现,体现研究的实用价值。
---
四、估值与因子效果分析
报告核心为因子构造与验证,没有采用复杂估值模型如DCF或市盈率法。因子通过信息系数(IC)、信息比率(IR)、年化多空收益与夏普比率等量化指标衡量表现。
- IC均值反映因子与未来收益的相关性,通常IC绝对值越高,预测能力越强。
- IR(信息比率)衡量因子收益风险调整后的稳定性。
- 夏普比率衡量超额收益与波动率的比值,稳定且波动低的因子夏普较高。
- 多空收益及胜率直接说明因子的实际选股收益和策略收益稳定性。
MPC5neut因子以其较高的IC绝对值和年化多空收益突出,说明这类因子的市场价值极高。
---
五、风险因素评估
- 样本区间为2010年至2020年7月,基于历史数据,模型可能面临过拟合或未来失效风险。
- 高频数据品质和完整性对因子计算至关重要,数据缺失和异常可能影响信号效果。
- 市场结构变化、政策调控以及主力操纵行为变化可能导致因子表现波动。
- 高频转低频逻辑反转表明投资者行为层面复杂,使用时需警惕策略反转风险。
- 报告提示模型为历史数据驱动,存在失效风险,投资需谨慎应用和动态调整。
---
六、批判性视角与细微差别
- 逻辑反转问题:高频交易因子在短期内与收益呈正相关,但经降频处理后反转表现负相关,反映散户的追涨杀跌和主力的短期操纵。这一点提示因子构造需谨慎选择时间粒度。
- 加权方案的缺陷:SOIR因子加权时赋予较高权重给表现不佳的低档位(SOIR1和SOIR2),导致整体因子综合表现低于优质档位,提示组合权重优化空间。
- 行业中性化的必要性:MPC因子进行流通市值和行业中性化后表现显著改善,提示未来SOIR类因子也可尝试类似处理,或提升效果。
- 样本内测试风险:回测均在历史均衡期进行,未充分捕获极端市场事件,模型在极端行情下稳定性存疑。
- 因子解释的假设基础:主力“对倒”等操纵行为推断虽有理论支持,但实际具体行为较难完全判定,存在一定假设风险。
- 缺少多因子联合测试:报告多为单因子分析,未来多因子组合策略绩效及风险尚需深入验证。
---
七、结论性综合
本文基于高频盘口订单簿数据,深入挖掘并构造了逐档订单失衡率(SOIR)和中间价变化率(MPC)两大类14个高频量价因子。通过合理的横截面标准化及高频至低频的衰减加权转化,获得了有效的月度低频选股因子。实证数据和回测结果显示:
- 高频SOIR因子在分钟级别与收益呈正相关,且影响能级与档位顺序吻合,权重应赋予靠近交易价格的档位;
- MPC因子短周期内表现为动量效应,中周期表现为反转,极端值及偏度指标捕捉到市场操纵行为的反向信号;
- 降频后,SOIR和MPC类因子均出现选股效果反转,体现了市场机制与投资者行为复杂性;
- 经过市值和行业中性化处理,MPC5neut因子表现最佳,IC均值达-7.26%,年化多空收益超30%,夏普高达2.88,为量价因子领域罕见佳绩;
- 在中证500和沪深300两大市场主流指数成分内,多数因子保持稳定的正收益水平,具备较强的适用性和鲁棒性;
- 报告色彩中立,选择客观数据证明理论并承认模型风险,但高频数据的治理复杂性、高频转低频的逻辑不一致需关注。
总的来看,该研究为中国A股市场高频数据驱动的量价选股逻辑提供了强有力的实证支持,提出的SOIR和MPC因子指标在市场实际选股中表现出良好的风险调整收益潜力。尤其是中性化处理后的MPC5neut因子是极具吸引力的量价策略工具。投资者与量化研究员应关注短期行情与长期反转的双重特征,合理选择高频与低频因子应用场景。
---
重要引用标注
文中关键数据和结论均有详细页码溯源,如MPC5neut因子表现页见[page::0,15,16,20],SOIR因子定义及案例页见[page::3,4],高频转低频方法页见[page::7,8],因子单因子回测详页见[page::10-18],相关性分析页见[page::9,10],样本池表现页见[page::18,19],报告整体总结见[page::19,20]。
---
总结
本报告通过对高频盘口的深刻挖掘和降频构建,成功设计出实用的高频量价选股因子体系,满足了市场量化选股策略对高频信息的挖掘需求,兼顾短期动态与长期趋势的解析,为未来多因子选股策略优化提供重要参考与实证基础。

图1:股票A盘口数据与SOIR值实例,展示顶档订单失衡率与短期涨幅联系。

图2:SOIR因子短线变动与价格走势同步性,强买入信号体现。

图5:MPC因子根据盘口中间价短期变化判断买卖力量的表现示例。

图14:MPC1neut因子回测收益曲线,表现显著。

图16:MPC5_neut因子回测收益曲线,量价选股顶尖表现。
---
(全文基于提供报告各页原文,严格按照内容事实分析解构,确保专业性与全面性。)