11.会员专属(499)

高频因子加工和指数增强策略 (副本)

由small_q创建,最终由small_q 被浏览 28 用户

高频数据大规模计算场景是未来量化多因子选股的发展趋势。日频因子竞争日益激烈,领先的公募和私募基金已经将重心转移至tick\逐笔数据的研究上,因此本文帮助研究人员灵活使用BigQuant平台做自定义高频因子构建,更好地基于数十T规模tick数据做因子研究和策略开发。

本文介绍如何从日内高频数据中加工因子,并进行因子分析和策略构建。示意图如下:

{w:100}{w:100}因子加工

在《选股因子系列研究(四十六)———日内分时成交中的玄机》研报中,我们提到了众多高频因子,比如平均单笔成交金额、平均单笔流出金额占比、大单资金净流入率、大单驱动涨幅,我们以大单驱动涨幅因子为例,介绍该因子从加工构建到最终策略回测。

因子定义

{w:100}{w:100}因子定义完全来自研报,这里我们直接构建出大单驱动涨幅因子,因为该因子为日频数据,若计算股票过去20日指标均值作为因子值,可直接使用衍生特征抽取模块即可。

因子表达式

在BigQuant平台上,高频因子的加工计算离不开“高频特征抽取-分钟到日频”模块,该模块的使用文档见: 高频特征抽取模块

我们可通过表达式算子快速构建大单驱动涨幅因子,构建的表达式如下:

_amt = amount
_ret = ret_sim(close, open)
big_order_ret = np.prod(1 + _ret*where(_amt >= _amt.sort_values(ascending=False).iloc[np.int(240*0.4-1)], 1, 0))

因子分析

表现概览

{w:100}{w:100}本例中,最小分位组表示因子值最大的一组。累计收益为37.92%,多空收益为20.99%,因子具备一定的选股效应。

IC分析

{w:100}{w:100}从IC可以看出大单驱动涨幅因子,总体为正,说明因子值越大,股票未来收益越大,这与因子定义逻辑是保持一致的。IC衰减比较厉害,说明该因子是短周期因子。

信号重合分析 {w:100}{w:100}该因子买入信号重合度不高,说明个股因子逐日变化较大,不同于基本面因子。

分组分析

{w:100}{w:100}可以看出,该因子是一个不错的因子,多空收益率曲线长期向上,本例中,第一分位组合表示因子值最大的一组,整体收益不错。

策略构建

策略内容

股票池:中证500

选股依据:调仓日在指定股票池根据大单驱动涨幅因子从大到小排序选股

选股数量:200只

调仓周期:2天

资金管理:等权重分配

回测结果

{w:100}{w:100}回测结果总收益为133.83%,超额收益如下:

超额收益

{w:100}{w:100}超额收益是扣除中证500指数后的收益,超额收益长期向上。

研报原文

/wiki/static/upload/d8/d8dd28dd-2a87-4a42-9a70-55fb610113e7.pdf

克隆代码

https://bigquant.com/experimentshare/0844cdfce80843e8ae26bd9eaeda5c0e

\

{link}