高频因子加工和指数增强策略 (副本)
由small_q创建,最终由small_q 被浏览 28 用户
高频数据大规模计算场景是未来量化多因子选股的发展趋势。日频因子竞争日益激烈,领先的公募和私募基金已经将重心转移至tick\逐笔数据的研究上,因此本文帮助研究人员灵活使用BigQuant平台做自定义高频因子构建,更好地基于数十T规模tick数据做因子研究和策略开发。
本文介绍如何从日内高频数据中加工因子,并进行因子分析和策略构建。示意图如下:
因子加工
在《选股因子系列研究(四十六)———日内分时成交中的玄机》研报中,我们提到了众多高频因子,比如平均单笔成交金额、平均单笔流出金额占比、大单资金净流入率、大单驱动涨幅,我们以大单驱动涨幅因子为例,介绍该因子从加工构建到最终策略回测。
因子定义
因子定义完全来自研报,这里我们直接构建出大单驱动涨幅因子,因为该因子为日频数据,若计算股票过去20日指标均值作为因子值,可直接使用衍生特征抽取模块即可。
因子表达式
在BigQuant平台上,高频因子的加工计算离不开“高频特征抽取-分钟到日频”模块,该模块的使用文档见: 高频特征抽取模块 。
我们可通过表达式算子快速构建大单驱动涨幅因子,构建的表达式如下:
_amt = amount
_ret = ret_sim(close, open)
big_order_ret = np.prod(1 + _ret*where(_amt >= _amt.sort_values(ascending=False).iloc[np.int(240*0.4-1)], 1, 0))
因子分析
表现概览
本例中,最小分位组表示因子值最大的一组。累计收益为37.92%,多空收益为20.99%,因子具备一定的选股效应。
IC分析
从IC可以看出大单驱动涨幅因子,总体为正,说明因子值越大,股票未来收益越大,这与因子定义逻辑是保持一致的。IC衰减比较厉害,说明该因子是短周期因子。
信号重合分析 该因子买入信号重合度不高,说明个股因子逐日变化较大,不同于基本面因子。
分组分析
可以看出,该因子是一个不错的因子,多空收益率曲线长期向上,本例中,第一分位组合表示因子值最大的一组,整体收益不错。
策略构建
策略内容
股票池:中证500
选股依据:调仓日在指定股票池根据大单驱动涨幅因子从大到小排序选股
选股数量:200只
调仓周期:2天
资金管理:等权重分配
回测结果
回测结果总收益为133.83%,超额收益如下:
超额收益
超额收益是扣除中证500指数后的收益,超额收益长期向上。
研报原文
/wiki/static/upload/d8/d8dd28dd-2a87-4a42-9a70-55fb610113e7.pdf
克隆代码
https://bigquant.com/experimentshare/0844cdfce80843e8ae26bd9eaeda5c0e
\