研报&论文

高频因子的现实和幻想-海通-20200730

由qxiao创建,最终由qxiao 被浏览 180 用户

摘要

高频行情数据蕴含丰富的信息,但市场上少有对此类数据的特征及如何应用的详细介绍。本文从高频行情数据的组成和结构出发,系统整理了十几个既有经济学逻辑,又表现良好的因子,并通过多因子指数增强模型展现其实践价值。

Level2行情数据概况。Level2行情数据是目前国内证券市场上对于交易信息包含最为完整,颗粒度最为精细的行情数据产品。主要有4种形式:分钟K线、盘口快照、委托队列、成交明细。Level2行情数据已覆盖在沪深两市上市的股票、可交易型基金、沪深交易所指数等大量品种,还在积极扩展纳入ETF期权等沪深交易所上市的衍生品,基本可以满足对A股市场的研究、投资和交易需求。

基于分钟成交数据的高频因子。根据分钟K线包含的信息,可构建高频偏度、下行波动占比、尾盘成交占比、量价相关性、改进反转、平均单笔流出金额占比、大单推动涨幅,共七个因子。它们的月均RankIC都在3%以上,年化ICIR都大于3。其中,尾盘成交占比因子表现最优,月均Rank IC为4.86%,年化ICIR为3.59。

基于TICK委托数据的高频因子。盘口委托挂单数据刻画了投资者的买入意愿,开盘后30分钟内的委买增量越大,投资者在这段时间内的买入意愿越强。开盘后净委买增额占比因子月均Rank IC为4.19%,年化ICIR为4.24。基于逐笔成交数据的高频因子。根据逐笔成交数据中的“买”、“卖”标记和单号信息,可构建开盘后净主买占比、开盘后净主买强度、大买成交占比、开盘后知情主卖占比,共四个因子。它们的月均Rank IC分别为3.31%、4.46%、4.35%、2.86%,年化ICIR分别为2.51、3.29、1.96、2.51。

基于TICK委托与逐笔成交数据的高频因子。委托挂单体现投资者尚未释放的交易意愿,而主买/主卖则代表已进行的交易行为。若将两者结合,可以得到广义的投资者主动买入意愿。开盘后买入意愿占比因子和开盘后买入意愿强度因子的月均Rank IC分别为4.34%和5.07%,年化ICIR分别为3.43和3.93。

高频因子在多因子组合中的应用。常用的在多因子模型中引入高频信息的方式有两种,一是在个股收益预测模型中直接加入高频因子,二是利用高频因子剔除空头个股。对于沪深300指数、中证500指数和中证800指数,同时使用这两种方法后,均可将指数增强策略的年化超额收益提升2.6%以上。并且,在时间序列上也较为稳定。在绝大部分年份中,引入高频因子后的策略都优于基准策略。

正文

/wiki/static/upload/bf/bfeb6663-61f8-4e57-a90d-ff4aeb712290.pdf

\

标签

高频因子
{link}