`

高频选股因子分类体系金融产品研究

创建于 更新于

摘要

本报告构建了基于订单失衡类、量价类、流动性类和资金流类的25个高频选股因子分类体系,并测试了因子在不同调仓频率和指数样本池中的表现。结果显示,多数因子收益随调仓频率提升显著,在市值行业中性化后稳定性增强,且在中证1000样本池内表现最好,沪深300样本池中订单失衡与量价类因子依然有效。ILLQ2、BAM、SAM等流动性及资金流因子表现尤为突出,为重要推荐因子 [page::0][page::6][page::47][page::48]

速读内容


高频选股因子分类体系及构建背景 [page::0][page::5][page::6]

  • 将25个高频因子分为订单失衡类、量价类、流动性类和资金流类四类。

- 高频数据涵盖盘口数据、成交数据及订单流数据,提供市场深层交易情绪信息。
  • 因子低频化处理采用衰减加权法,月因子基于过去20个交易日数据衰减权重构造,并在日、周、两周、月频间进行了两种低频化方法对比,选取换手率较低、费用效率较好的方案构建因子。

- 测试时间覆盖2010年至2022年,各类因子在不同样本池下测试效果提供详尽对比。

订单失衡类因子绩效表现 [page::10][page::11][page::12][page::13][page::14][page::15]


  • 五个订单失衡因子VOI、MOFI、OIR、SOIR、PIR在全市场多频调仓下表现稳健。

- 多空年化收益随调仓频率提高,日频调仓在剔除手续费后依然表现优异,最高年化收益近40%。
  • PIR因子表现最佳,扣手续费后仍有近30%年化收益,展现出强选股能力。

- 因子投资逻辑基于短期买盘压力与长期股价负相关关系,订单失衡反映资金面和机构操纵行为。

量价类因子绩效表现 [page::18][page::19][page::20][page::21][page::22][page::23]


  • 包括MPB、MPC、MPCmax、MPCskew、MAX、RSJ六个因子,表现稳健提升。

- 日频调仓MPB因子无手续费年化收益可达68%,扣手续费后仍超40%。
  • MPC类因子选股能力最强,日频调仓无手续费年化回报可超72%,体现了极佳的市场短期价格预期捕捉能力。

- 其他量价类因子均具备反转特性,可替代传统反转因子。
  • 投资逻辑涵盖散户追涨杀跌及机构市场操控,反映短期涨跌后长期回落的价量关系。


流动性类因子绩效表现 [page::27][page::28][page::29][page::30][page::31][page::32][page::33]


  • 七个流动性因子ILLQ、ILLIQ2、LSIlliq、Gamma、Lambda、LogquoteSlope、MCI_B均表现出较强的选股能力。

- ILLIQ2日频调仓多空年化收益高达74.34%,扣手续费后仍超60%,为重点推荐因子。
  • 因子值高表示股票流动性差,反映低流动性溢价逻辑,换手率低,适合长期持有。

- 因子收益稳定,适合构建流动性风险溢价策略。

资金流类因子绩效表现 [page::36][page::37][page::38][page::39][page::40][page::41][page::42][page::43]


  • 资金流因子PTOR、BNI、MB、BAM、SAM、BACov、SACov在不同调仓频率均实现正向多空收益。

- BAM和SAM尤其突出,日频调仓多空年化收益分别达到60.36%和55.52%,表现稳定换手率低。
  • 指标覆盖成交量、成交金额、笔数方向,反映资金持续关注和主力操纵行为。

- 资金流因子为捕捉短期资金关注及散户行为的重要工具。

高频因子中性化与不同指数样本池表现 [page::43][page::44][page::45][page::46][page::47]


  • 市值与行业中性化提升因子稳定性,部分因子年化收益明显改善。

- 各类因子在全市场、中证1000和中证500的样本池内均表现良好,中证1000表现最佳,因子收益率往往较全市场更高,体现高频因子在小市值股票中的优势。
  • 沪深300样本池中,订单失衡类和量价类因子依旧有效,流动性及资金流类表现相对弱化,可能因大市值股资金影响较弱所致。

- 随调仓频率提升,多数因子年化多空收益显著增加,支持高频因子在量化选股中的实用价值。

深度阅读

金融产品深度报告——高频选股因子分类体系详尽分析



---

1. 元数据与报告概览



报告标题与信息

  • 标题:《高频选股因子分类体系》

- 机构:中信建投证券股份有限公司
  • 分析师:陈升锐,金融产品组首席分析师

- 发布日期:2023年2月25日
  • 研究主题:高频选股因子体系构建及全市场不同样本池下的选股绩效测试


核心论点与目标


报告在对此前五篇专题研究报告的总结基础上,新增了10个高频因子,系统构建了涵盖25个因子的高频选股因子分类体系,涵盖订单失衡类、量价类、流动性类和资金流类四个类别。报告核心结论为:
  • 高频因子的选股能力在调仓频率提升情况下多空年化收益普遍提高。

- 市值行业中性化能够提高因子的收益稳定性和选股表现。
  • 四类高频因子在全市场及主流指数样本池(中证1000、中证500、沪深300)均表现出较好选股能力,尤其在中证1000表现最佳。

- 订单失衡类和量价类因子在沪深300也表现有效。
  • 部分重点推荐因子(如ILLIQ2、BAM、SAM)的年化多空收益在日频调仓时可达60%以上。


[page::0,5,47]

---

2. 高频选股因子分类体系与低频化处理



2.1 高频因子分类体系


根据因子提取数据及投资逻辑,25个高频因子被划分为四类:

| 因子类别 | 代表因子 | 主要数据来源 |
| ------------ | --------------------------------- | -------------------------------- |
| 订单失衡类 | VOI、OIR、SOIR、MOFIWeight、PIR | 盘口买卖五档买卖委托价格与量级数据 |
| 量价类 | MPB、MPC、MPC
max、MPCskew、MAX、RSJ | 分钟级价格与成交量数据 |
| 流动性类 | ILLIQ、ILLIQ2、LSIlliq、Gamma、Lambda、LogquoteSlope、MCI
B | 日频及分钟级量价,委托量数据 |
| 资金流类 | PTOR、BNI、MB、BAM、SAM、BACov、SACov | 高频成交数据(成交金额、笔数) |

此外,报告详细阐述了高频因子的低频化转换流程,包括对分钟因子至日因子、日因子至月因子使用衰减加权方法,保证信息时效性和降低噪音,同时提出了两种方法对比(方法一更低换手率更优)作为最终选用方案。测试表明,因子低频化方法影响收益与换手率平衡,采用方法一获得更优后期实盘应用效果。

[page::5,6,7]

---

3. 高频因子详细解读



3.1 订单失衡类因子



定义与逻辑


订单失衡类因子是基于盘口买卖委托的量价数据,主要体现短期买卖压力对长期收益的影响逻辑。具体因子包括VOI、MOFI、OIR、SOIR、PIR,均衡量买卖委托的数量或价格失衡程度。其背后逻辑在于短期买盘压力大时,长期股价收益往往呈现负相关,特别归因于散户追涨杀跌和主力对倒现象从而导致价格回调。

主要数据及计算示范——VOI因子


VOI(Volume Order Imbalance)计算买卖量的变化差异,传统方法只基于买一、卖一,报告创新性地对盘口五档进行衰减权重加权处理以提升信号稳定性。

绩效表现

  • VOI因子在无手续费情况下日频调仓多空年化收益最高达约39%,扣费后约24.6%。

- 随调仓频率提高,多空收益显著提升,但手续费对日频影响较大。
  • 五个订单失衡因子整体表现稳健,多空年化收益通常在15%-40%之间。

- 高频因子IC值均为负,反映短期买卖压力增大对应长期收益趋向下行。

图示分析(图1)表明无论是否计费,调仓频率越高累计收益增长越显著,体现短期信号的有效性和高频调仓的潜力。

[page::8,9,10,11,12,13,14,15]

---

3.2 量价类因子



定义与逻辑


基于高频价格数据(买卖一价、中间价、成交均价等)构建,包括MPB、MPC、MPCmax、MPCskew、MAX、RSJ六个因子。因子关注短期价格反转及极端价格变动,反映散户追涨杀跌与机构操控诱发的短线波动逻辑。MPB、MPC、MAX表现为反转因子,RSJ则测量波动率的不对称性。

绩效表现

  • MPC因子的日频调仓多空年化收益最高,可达72%,扣费后43%,表现优于MPB和其他量价因子。

- MPCmax和MPCskew分别反映极端波动幅度及偏度,均有显著的选股能力,且高频调仓回报明显增长。
  • RSJ因子作为波动率偏度指标,多空年化收益介于20%-45%间,表现稳定。

- 量价类因子整体多空年化收益约20%-70%,具有明显的选股价值。

图6-11清晰展示了各因子无论是否计费,多空收益均随调仓频率上升而递增,尤其是日频因子,表现最优。

[page::15,16,17,18,19,20,21,22,23]

---

3.3 流动性类因子



定义与逻辑


涵盖ILLIQ、ILLIQ2、LSIlliq、Gamma、Lambda、LogquoteSlope、MCIB七个因子。核心逻辑为流动性越差,股票获得低流动性溢价的概率越高,预期未来表现更佳。因子涵盖日频和分钟级数据,多因子基于成交量与价格变化建模,部分因子采用回归捕捉成交额对收益的冲击强度。

绩效表现

  • ILLIQ2为重点推荐因子之一,日频无手续费多空年化收益高达74%,扣费后59%,换手率较低。

- Gamma、Lambda因子表现紧随ILLIQ2,多空年化收益在30%-50%区间,且稳定性优良。
  • 其余流动性类因子均表现稳定,收益水平在25%-35%不等,对应的夏普率和胜率均较高。

- 手续费对流动性类因子影响相对较小,调仓频率提升带来显著收益增加。

图12-17展示各流动性因子多空累计收益曲线,均呈现平滑上升趋势。

[page::24,25,26,27,28,29,30,31,32,33]

---

3.4 资金流类因子



定义与逻辑


七个因子PTOR、BNI、MB、BAM、SAM、BACov、SACov主要依据高频成交量、金额、笔数,揭示股票资金关注度及大资金驱动效果。PTOR关注平均单笔成交流出金额比例,BNI集中对大资金流入比例考察,BAM与SAM分别表征主买主卖金额强度,BACov和SACov反映成交金额离散度。

绩效表现

  • BAM和SAM为重点推荐因子,日频多空年化收益达60%及55%,且换手率较低稳定性佳。

- PTOR、BNI、MB等因子多空年化收益整体处于20%-40%区间。
  • 资金流类因子上涨趋势明显,调仓频率提升收益改善显著,手续费影响有限。


图18-25显示资金流类因子多空绩效各阶段趋势一致,且在扣费情形下保持较好表现。

[page::34,35,36,37,38,39,40,41,42,43]

---

4. 因子中性化与样本池表现



4.1 市值与行业中性化效果


中信建投对多个高频因子(如Lambda、ILLIQ2、PCM
max、PTOR)应用行业市值中性化,测试表明中性化极大提升因子多空收益稳定性与夏普比率,最大回撤明显下降。经过中性化处理后,因子收益曲线更平滑,呈现更优风险调整表现。

图26清晰对比了五个典型因子中性化前后的多空收益曲线,更加凸显波动性降低和收益提升效果。

4.2 各指数样本池表现



| 样本池 | 订单失衡类收益区间 | 量价类收益区间 | 流动性类收益区间 | 资金流类收益区间 | 说明 |
| ---------- | ------------------ | -------------- | ---------------- | ---------------- | ----------------------------------------- |
| 全市场 | 15%-40% | 20%-70% | 25%-75% | 20%-70% | 所有类别稳定选股能力 |
| 中证 1000 | 20%-50% | 20%-80% | 25%-70% | 15%-65% | 因子选股能力明显提升,小市值表现更佳 |
| 中证 500 | 10%-50% | 10%-40% | 15%-50% | 10%-45% | 效果相较全市场稍弱,但依然有效 |
| 沪深 300 | 10%-40% | 5%-35% | 较弱 | 较弱 | 订单失衡和量价类维持有效,流动性及资金流减弱 |

整体来看,中证1000样本池中表现最优,流动性与资金流因子受大盘股资金流动性影响较大,在沪深300中效果减弱。

[page::43,44,45,46,47]

---

5. 图表深度解读



以下精选部分具代表性图表剖析:

5.1 订单失衡类因子VOI(图1、表3)

  • 图1展示月频、两周、周、日调仓下VOI因子多空累积收益,蓝色(无手续费)曲线明显高于红色(考虑手续费),尤其日频多空年化收益最高接近40%。

- 表3详细列出各调仓频率信息系数IC均值、夏普比率、最大回撤等指标,证实高频率调仓收益与风险调整比率均最佳。

5.2 量价类因子MPC(图7、表9)

  • 图7呈现MPC因子四种调仓频率多空收益路径,日频明显领先,曲线平滑且上扬。

- 表9展示MPC因子IC均值负值较大,反转特征明显,日频扣费后多空年化收益仍高达43%。

5.3 流动性类因子ILLIQ2(图13、表15)

  • 图13显示ILLIQ2因子调仓频率变化下多空收益走势,日频无手续费最高多空年化近75%,扣费后59%。

- 表15厨深度数据验证该因子流动性低与收益高的逻辑。

5.4 资金流类因子BAM(图22、表24)

  • 图22描绘BAM因子不同调仓频率收益路径,多空收益保持持续上升趋势,日频调仓收益尤为亮眼。

- 表24揭示BAM因子IC均值较小负值,表明反转属性,综合表现优异且换手率低。

5.5 中性化影响(图26、表28)

  • 图26所示四个典型因子中性化后,红线(有中性化)相较无中性化蓝线表现收益更高且波动更小。

- 表28数据进一步说明行业和市值中性化显著优化夏普比和回撤收益率,风险调整有效提升。

[page::11,27,39,40,44]

---

6. 估值、风险因素与批判性视角



本报告主要为因子研究与绩效测试,未涉及传统企业估值模型。

风险提示

  • 所有结论皆基于历史数据,未来因子有效性存在失效风险。

- 市场系统性风险及政策变动等不确定因素可能对策略表现产生较大影响。
  • 模型假设与实际交易环境可能存在偏差,限于数据完整性,缺失少量信息或影响结果的精确性。

- 报告无投资建议意图,保持独立理性,投资决策须结合个体风险承受能力。

批判性分析

  • 高频调仓带高收益同时伴随手续费提升时收益大幅缩水,说明交易成本为重要制约。

- 多数因子表现与高频数据的时效性强相关,中频或低频可能导致衰减。
  • 流动性及资金流因子在大盘股样本表现不佳反映了因子在市场结构不同区间差异性。

- 部分因子(如订单失衡类)IC负值反映是反转因子,交易者需关注策略时滞和执行风险。

整体,报告科学系统且数据充分,但因子推广实际需配合稳健交易执行策略及交易成本管理。

[page::48]

---

7. 结论性综合



本报告系统整合并扩展了25个高频选股因子,涵盖订单失衡、量价、流动性和资金流四大类,结合丰富的历史回测提供了多角度的有效性验证。主要发现包括:
  • 高频因子多数具备显著的多空选股能力,且大部分因子收益随调仓频率提升呈上涨趋势,尤其日频策略表现出色。

- 行业及市值中性化处理明显提升因子收益的稳定性和风险调整后表现。
  • 因子在不同样本池均有稳健表现,其中中证1000(小市值股)环节效果最优,沪深300市场大盘股中订单失衡及量价因子依然有效。

- 订单失衡类因子表现稳健,尽管IC值为负,呈反转特征,但整体多空收益可观(15%-40%年化);量价因子表现波动较大,但收益上限更高(最高日频72%年化)。
  • 流动性类和资金流类因子表现突出,部分因子ILLIQ2、BAM、SAM在日频和扣费后依然能保持50%-60%的年化多空收益,是重点推荐对象。

- 交易成本对日频收益影响显著,综合考虑换手率和费用是实际运用的关键。

四类高频因子构建的模型为量化选股提供了强有力的数据支撑和策略保障,适合结合实际交易策略应用。同时,报告详尽的回测框架和风险提醒为投资者理解高频量价信息及其潜在应用提供了充分依据。

---

总结:


《高频选股因子分类体系》报告深入剖析高频量价及成交信息,创新整合并扩展了丰富的选股因子体系,充分验证了高频数据在提升量化投资收益与风险调整表现的实用价值,尤其体现于提高调仓频率、实施市值行业中性化及挑选适宜样本池的策略中。鉴于手续费敏感性及市场结构差异,后续策略应用需谨慎权衡交易成本和投资风格适配性。

[page::0-51]

报告