`

高频量价选股因子初探:——因子深度研究系列

创建于 更新于

摘要

本报告针对高频盘口数据构建了四个量价选股因子(VOI、VOI2、OIR、MPB),并将其转为月频低频因子进行回测。结果显示MPB因子表现最佳,年化多空收益21.24%、夏普率2.68。VOI和OIR因子在高频表现正相关但转为低频后出现逻辑反转,反映短期散户追涨杀跌与主力操纵影响。报告系统分析因子构造、降频方法及其与传统因子的相关性,为构建有效量价选股策略提供了有力支持 [page::0][page::5][page::6][page::14]

速读内容

  • 高频量价选股因子构建及定义 [page::3][page::4][page::5]:

- 订单失衡因子(VOI,VOI1和VOI2)基于委托买卖量差异。
- 订单失衡率(OIR)为加权买卖委托量差与总和的比值,纠正VOI未考虑规模大小的不足。
- 市价偏离度(MPB)为平均交易价格与买卖中间价的差值,反映买卖方主动性。
  • 高频转低频构造流程 [page::5]:

- 高频分钟因子先截面标准化,再等权求日因子,最后用衰减加权获得月因子。
  • 高频与低频因子关系及逻辑反转分析 [page::6][page::7][page::8]:





- 高频因子与收益率正相关,但降频后部分因子(VOI、OIR)呈现负相关。
- 原因包括散户追涨杀跌行为及主力短期操纵导致短期买卖压力与长期价格走势反向。
  • 高频量价因子交易逻辑及影响方向汇总 [page::9]:

| 因子名称 | 交易逻辑 | 高频影响方向 | 低频影响方向 |
|--------------|--------------------------------------------------------------------------------------------|--------------|--------------|
| 订单失衡 (VOI) | 反映知情交易者未反映信息,订单不平衡大则买压大,短期价格上涨;但散户行为和主力操纵使低频反向 | 正向 | 负向 |
| 订单失衡率 (OIR) | 衡量买卖委托量相对实力,补充VOI,强买卖压力同样出现短期正向,长期反向 | 正向 | 负向 |
| 市价偏离度 (MPB) | 反映交易平均价相对中间价偏离,卖方发起时未来价格趋跌,买方发起时未来价格趋涨 | 负向 | 负向 |
  • 高频量价因子与传统因子相关性 [page::10]:

- VOI1与MPB与自由流通市值相关性较强(>0.5),需市值中性化处理。
- VOI2与ROICTTM、Momentum12m相关,需要相应剔除影响。
- OIR与Momentum各期分位因子相关性高,需剔除Momentum12m影响。
  • 高频量价因子单因子回测表现 [page::11][page::12][page::13]:

- VOI1因子:IC均值-2.74%,年化收益12.45%,夏普1.69。

- VOI2因子:IC均值-3.35%,年化收益14.73%,夏普1.87。

- VOI2去除ROIC
TTM及Momentum12m:IC均值-3.59%,年化收益15.12%,夏普1.91。

- OIR因子:IC均值-3.7%,年化收益16.05%,夏普1.45。

- OIR剔除Momentum
12m后:IC均值-4.19%,年化收益17.75%,夏普1.66。

- MPB因子表现最佳,IC均值-5.23%,年化多空收益21.24%,夏普2.68,最大回撤仅4.27%。
  • 结论与展望 [page::14]:

- 高频选股因子具备良好选股效果,尤其MPB因子。
- 高频与低频因子表现反转体现出市场微结构特性影响。
- 后续报告将深入挖掘低相关性的有效高频选股因子,用于多因子模型构建。

深度阅读

高频量价选股因子初探报告详尽分析



---

1. 元数据与报告概览(引言)



报告题目:《高频量价选股因子初探——因子深度研究系列》
作者:丁鲁明、陈升锐
发布机构:中信建投证券研究发展部
发布日期:2020年7月9日
研究主题:基于高频盘口数据挖掘选股因子,通过对订单失衡(VOI)、订单失衡率(OIR)及市价偏离度(MPB)这三个因子构造及其降频后的表现进行深入探讨,验证其在量化选股中的有效性,并研究因子在高频与低频间的表现反转逻辑。

核心论点
  • 高频盘口数据蕴含隐藏的有用信息,能够反映市场情绪及知情交易者的行为。

- 构建四个高频量价选股因子(VOI1、VOI2、OIR、MPB),利用衰减加权方法对盘口多档数据进行处理。
  • 将高频因子通过截面标准化及加权方法转化为低频(月频)因子后,发现VOI和OIR因子在低频市场表现出现逻辑反转(高频正相关,低频负相关)。

- 其中MPB因子虽在高频出现负相关,转换为低频仍保持负相关,表现稳定且选股效果最佳,年化多空收益21.24%,夏普比率达2.68。
  • 因子剔除与传统选股因子的相关性后,均表现出较好的选股效果。


总体而言,报告指出基于高频量价数据构建的因子在适当转换频率后,在A股市场中具备较强的选股能力,且为填补传统因子饱和下的选股新策略提供了新思路。[page::0,1]

---

2. 逐节深读与解构



2.1 高频量价因子定义和投资逻辑



2.1.1 引言



随着传统财务和低频量价因子的渐趋饱和,市场迫切寻求新信息源。高频盘口数据记录了买卖盘价格和委托量,是反映市场短时情绪和行为的扎实数据资源。通过高频盘口数据,可以更直观地理解知情交易者的行为模式及市场供需动态,从而提升选股的预测能力。

报告中以浦发银行盘口数据作为例证,展示买一卖一委托量差异如何预示股价的短期走势。例如买一量为3017手,而卖一为295手,显示买盘更强,股价短期上涨可能性较大。[page::2]

2.1.2 VOI因子(订单失衡)



VOI因子定义为买委托量变化与卖委托量变化之差。基于Chordia和Subrahmanyam(2004)在纽交所的研究,订单失衡度与收益正相关,反映市场的买卖压力。

数学表达:

$$VOI1t = \Delta Vt^B - \Delta Vt^A$$

其中,$\Delta V
t^B$与$\Delta Vt^A$分别代表买卖委托量的价格调整加权变化,具体规则基于买卖价格相较前一时刻的变动有所不同。

报告还提出改进:不仅使用买卖第一档盘口数据,还采用五档盘口的衰减加权委托量以获取更全面信息:

$$V
t^{WB(WA)} = \frac{\sum wi \times V{i,t}^{B(A)}}{\sum wi}, \quad w=1-\frac{i-1}{5}, i=1,2,...,5$$

进而定义VOI2因子:

$$VOI2
t = \Delta Vt^{WB} - \Delta Vt^{WA}$$

这里,权重递减使第一档盘口量贡献最大,逐档递减,体现不同盘口深度对买卖压力的影响递减。[page::3]

2.1.3 OIR因子(订单失衡率)



订单失衡率(OIR)定义为买卖委托量差与其和的比例:

$$OIRt = \frac{Vt^{WB} - Vt^{WA}}{Vt^{WB} + Vt^{WA}}$$

该比率衡量相对买卖力量,而非简单差值,能区分绝对差异大但市场买卖力量接近的情况。例如,差额100但总量大时买压力并不显著,需根据比例大小更准确判断买卖劣势。衰减加权权重同VOI2。

OIR因子弥补VOI的不足,反映市场参与者相对买卖意愿,从而更准确预测价格走向。[page::4]

2.1.4 MPB因子(市价偏离度)



MPB定义为单位时间段内的平均成交价与同期中间价(买一卖一价的算术平均)的偏离差:

$$MPB
t = \overline{TP}t - \overline{MP}t$$

其中,

$$\overline{MP}t = \frac{Pt^B + Pt^A}{2}$$

$$\overline{TP}
t = \frac{Tt}{Vt} \quad (Vt \neq 0), \quad \text{否则取前一时刻成交价格}$$

平均成交价若高于平均中间价,说明卖方发起主导交易,形成卖压,价格可能下跌,反之亦然。

因其均值回归性特征,MPB是价格短期走势的有效预测指标。[page::4-5]

2.2 高频转低频的方法和逻辑



因高频数据较为细碎,投资者多关注月度换仓频率,故将高频分钟因子转化为月度低频因子。
  • 首先对每日每分钟截面内因子值做标准化处理,剔除市场与个股共性影响。

- 将标准化后的分钟因子简单等权合成为日因子。
  • 通过距离月底交易日的倒数权重(时间越近权重越大,采用线性衰减)加权日因子,得出月度因子,确保信息时效性。


此方法兼顾了高频因子信息丰富和低频操作稳定性。[page::5]

2.3 高频量价因子低频化反转特性分析



【表1】数据显示,VOI、VOI2、OIR因子的分钟IC均值均为正(11%-13%),而对应的月频IC均值转为负值(-2.7%至-5.2%) ,MPB分钟IC为负(-13.78%),月频IC仍为负(-5.23%)。显示VOI类因子高频与收益正相关,低频表现反转。

推断根因:
  • 短期内散户存在追涨杀跌行为,高频买卖委托受到市场情绪驱动。

- 主力利用大单“对倒”操纵价格,造成短时买卖压力与股票价格正相关,但长期看价格回落。

具体实例(图3-6)展示某股票大单卖出(VOI骤降)后次日股价大幅上涨,另一案例大单拉抬(VOI骤升)后次日股价回落,证实了此逻辑。

MPB因子结构不同,表征的买卖方向逻辑在高频与低频均一致,故其低频表现稳定。此外,将VOI2及OIR剥离高相关因子(ROIC
TTM、Momentum12m)后,性能进一步提升,说明因子独立有效。[page::6-8]

---

3. 图表深度解读



3.1 图1:浦发银行盘口数据实例



展示买一(3017手)和卖一(295手)委托量对制定价格波动的即时影响,直观反映买卖力量不均衡。该静态快照说明盘口委托量的具体构造及使用场景。[page::2]

3.2 图2:天软高频分钟数据样例



表现某股票连续时间段的盘口买卖五档委托量,以及各种价格指标,展示盘口数据的细节维度,为高频因子构造提供数据基础。[page::3]

3.3 表1:高频量价因子与低频因子IC变化对照表



显示VOI、VOI2、OIR高频和低频的相关系数反转和幅度变化,佐证因子高频有效性及低频衰减与逻辑反转的现象,提示因子应用的频率风险。[page::6]

3.4 图3-6:高频量价因子逻辑反转实例图


  • 图3-4:VOI2因子时间序列与对应收盘价变化,直观演示大单卖出或买入对次日股价走势产生的反向影响。

- 图5-6:OIR因子时间序列对应的股价走势,反映散户追涨杀跌及主力对倒行为对长期涨跌影响逻辑。[page::7-8]

3.5 表2:高频量价因子交易逻辑及影响方向汇总



简明总结VOI、OIR、MPB因子在高频与低频层面上对收益的影响方向,突出因子存在的频率反转现象,明确投资者选用因子时需注意的信号含义。[page::9]

3.6 表3:高频因子与常用因子相关性矩阵



系统展示四个高频因子与自由流通市值、盈利能力、成长性、动量等传统因子之间的相关性。发现VOI1和MPB与市值相关性较强,需做市值中性化处理;VOI2和OIR与部分因子强相关,提出对其做中性化处理,确保独立贡献。[page::10]

3.7 图7-12:四个因子选股绩效图与IC指标



分别展示VOI1、VOI2、VOI2剔除ROIC
TTM及Momentum12m、OIR、OIR剔除Momentum12m及MPB的IC统计及多空组合表现曲线。所有因子均实现正收益,MPB的综合表现最优,夏普比率达2.68,年化收益21.24%,最大回撤仅4.27%,风险收益比突出,显示其较强的选股能力和稳健性。[page::11-13]

---

4. 估值分析



本报告核心为因子构建和选股效果验证,未纳入传统财务估值分析方法,如DCF或市盈率法。研究关注因子的IC值、年化收益率、夏普比率等多维风险收益指标,直接以因子驱动的持仓表现衡量价值。

基于此,因子剥离相关性和中性化处理可以被视为“风险调整”过程,确保因子独立性和防止市值、动量等已知因子冗余。报告通过经典统计指标直观刻画因子的选择价值,无额外财务估值模型。[page::10-14]

---

5. 风险因素评估



报告指出高频因子特别是VOI和OIR因子存在高频转低频逻辑反转风险:
  • 短期市场操纵风险:大单“对倒”行为将导致高频正相关信号带来低频负相关表现。

- 散户行为扭曲风险:散户追高杀跌等行为短期影响因子表现,不利于长期稳定预测。
  • 信息时效性折损:高频数据向低频降频过程中信息有效性衰减,可能导致预测信号减弱。

- 因子相关性风险:高相关因子可能混淆信号,因此需剔除与传统因子的相关部分以保证因子纯净性。

缓解策略:采用中性化方法剔除市值、行业、动量等相关因子成分,利用月频衰减加权提升因子稳定性,结合多因子综合分析减弱单一因子的不足。[page::5,9-13]

---

6. 批判性视角与细微差别


  • 因子反转逻辑挑战稳定应用:VOI和OIR因子高频与低频表现反转,提示单纯依赖高频信号并不可靠。投资者需结合频率特性及市场环境审慎使用。

- 样本选择与市场适用性:回测数据为2010-2019年中国A股全市场,因子表现依赖于该市场结构、散户与主力行为,外部市场或未来环境变化可能影响因子有效性。
  • 因子数据覆盖和计算复杂性:构造衰减加权多档盘口因子对数据质量和计算要求较高,实际应用中可能受限于数据可得性和计算成本。

- 风险调整与绩效解释:部分极值处理和因子剔除步骤未详述具体方法细节,可能影响因子鲁棒性评估的透明度。
  • 报告整体偏重因子表现正面,风险讨论较为有限,未来研究可补充因子在极端市场环境下的稳健性测试。


---

7. 结论性综合总结



本报告系统深入地研究了基于高频盘口数据构建的三类高频量价因子——订单失衡(VOI1和VOI2)、订单失衡率(OIR)与市价偏离度(MPB),通过数学模型精确定义并应用衰减加权涵盖盘口多档数据,有效提升因子信息表现。研究创新地采用了从高频到低频的降频转化方法,包括截面标准化、等权日内均值及基于距离调仓日的时间衰减加权,有效解决信息时效性的问题。

报告发现在高频层面,VOI和OIR因子与未来收益呈明显正相关,反映知情交易者的市场买卖压力,中频或低频转换后,该关系出现反向,这是由于主力“对倒”行为和散户行为短期追涨杀跌导致的市场结构问题。MPB因子作为价格均值回归指标,表现稳定,无频率反转现象。

剔除VOI2和OIR因子与传统因子如ROIC、动量的相关性后,其选股能力有所提升,表现更为纯净。四个因子均在2010-2019年十年间显示良好的选股能力,其中MPB因子表现最优,年化收益达21.24%,夏普比率2.68,最大回撤4.27%,展示了出色的风险调整后收益及稳健性,适用于月度调仓量化选股策略。

报告所附大量图表(盘口数据实证、因子时间序列走势、选股多空收益表现等)扎实支撑了理论推断和量化反馈。因子与传统因子IC相关性分析为构建多因子模型奠定基础。总体来看,该项研究为国内市场高频量价选股因子的探索提供了理论基础与实证支持,引领了传统低频因子研究向更高频维度的拓展。

投资者在实际使用时,应结合因子频率转换的逻辑反转特性,合理设计组合和风险管理框架,防范主力操纵及散户行为导致的信号误判风险,并关注数据质量问题。后续研究期待继续深化高频量价因子,挖掘与传统因子正交的新因子,丰富量化选股工具箱。

---

总结:


  • 报告主题:基于高频盘口数据构建量价选股因子,揭示因子在高频和低频转换中的特性及投资逻辑。

- 关键因子:[VOI1, VOI2]——订单失衡;OIR——订单失衡率;MPB——市价偏离度。
  • 核心发现:VOI、OIR高频正相关,低频反转;MPB表现稳定且优异。

- 方法创新:数据加权、多档盘口使用,高频转低频的时效加权方法。
  • 实证结果:因子均有显著的IC和正的选股收益,MPB因子表现最佳。

- 应用注意:关注高频转低频逻辑反转风险和因子中性化处理。
  • 未来展望:挖掘低相关性的高频新因子,完善多因子模型。


---

溯源标注参考
[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14]

---

如果需要对具体页码的某图表或术语深入解释,可再行细分说明。

报告