高频因子

高频因子是金融领域中的一个术语,主要指的是影响资产价格变动的高频率数据信号。这些因子通常来源于市场微观结构、短暂的市场情绪变化、流动性波动等,并在极短的时间内对资产价格产生影响。与低频因子(如宏观经济指标、企业财报等)不同,高频因子捕捉的是市场瞬间的、非线性的动态变化。 高频交易者通过运用复杂的算法和强大的计算机技术,实时分析和处理这些高频因子,以期在毫秒甚至微秒级别的时间内捕捉交易机会并实现快速获利。然而,高频交易也带来了市场操纵、技术风险、增加市场波动性等问题,因此受到了严格的监管和争议。 总体来说,高频因子是金融市场高度信息化和技术化的产物,对于理解市场的微观动态以及实现超短期的交易策略具有重要的意义。

Dai读取高频因子构建一个简单的多因子策略

https://bigquant.com/codeshare/5cc967b1-9dd1-45ef-a021-3194dd0c1e4f

\

更新时间:2024-04-26 01:17

高频因子构建:4、进阶玩法之存中介表优化窗口函数性能

高频因子加工,本质上就是将日内的高频信息降频为日频,有些因子在降频为日频后,还要向前取移动平均,例如5日、20日

以20日移动平均为例,一个低效率的方式是,加工高频因子时,取数据就多取20天的,以一天5000只票240分钟为例,这种取数据就要取到5000 X 240 X 20 = 24,000,000 条数据

但是一个更高效的方法是,加工高频因子时,只取一天的数据,高频因子加工好后村一个临时表,之后在临时表中计算20日滚动平均,这样的话,取数据就只需 5000 X 240 X 1 + 5000 X 20 = 1,300,000,效率有很大提高

我们以分钟交易量方差,再取20日移动平均为例

更新时间:2024-04-25 07:37

高频因子构建:2、多只票一天的加工方式

本文档,我们会总结一些典型的高频因子,加工方式为“多只票,一天”

这种因子通常是加工时有截面运算的需求,所以必须获取全市场股票的信息

提示:加工高频因子最好将资源开大,否则Kernel容易崩溃


1. 交易量截面百分比排序的方差、偏度、峰度

2. 交易量截面百分比排序方差偏度峰度的市值与行业中性化


\

策略源码:

{{membership}}


[https://bigquant.com/codeshare/9097b8fb-6f8d-4eed-87ee-20695f88ce39](https://bigquant.com/codeshare/9097b

更新时间:2024-04-25 07:36

高频因子构建:1、一只票多天的加工方式

本文档,我们会总结一些典型的高频因子,加工方式为“一只票,多天”

这种因子的加工时通常不需要截面运算,因此不需要获取其他股票的信息

提示:加工高频因子最好将资源开大,否则Kernel容易崩溃

\

1. 全天内不同时间段内的成交量占全天成交量之比

  • 时间段01:09:30-09:35
  • 时间段02:09:30-09:45
  • 时间段03:09:30-10:00
  • 时间段04:09:30-10:30
  • 时间段05:14:00-15:00
  • 时间段06:14:30-15:00
  • 时间段07:14:45-15:00
  • 时间段08:14:55-15:00
  • 时间

更新时间:2024-04-25 07:36

关于中金高频多因子构建的求助

最近读到中金量化多因子系列中提到一些高频因子,比如50分钟K线最高与最低价相关系数平方的均值、成交量最高50根K线成交量收益率动量等等,那么根据分钟行情数据构建出来的话,应该是计算出多行的数据,那么对于我们量化爱好者来说,做因子测试的话是利用这些日内多行的数据吗?还是需要做降频处理到每日只取一行数据?之前听万老师讲课听过一般会对高频因子做降频处理,这样处理数据算力负担不会太大。所以有些疑惑,一、想确认下刚才所讲的这两个高频因子是需要取多行数据还是可以降频处理?二、如果可以做降频处理,那么采用什么方式处理比较好?比如取它们均值还是什么?

更新时间:2024-03-26 12:56

高频因子的时间段是怎么定义的?

更新时间:2023-10-29 04:10

高频因子抽取到日频报错

https://bigquant.com/wiki/doc/tezheng-ri-xIjPe1UFMu

这个例子程序也一直报错

更新时间:2023-10-09 07:10

平台给的模版高频因子抽取报错

https://bigquant.com/experimentshare/5c62736dd4bb44c9a4831181e1a00868

{w:100}

更新时间:2023-10-09 02:53

Dai读取高频因子构建一个简单多因子策略

https://bigquant.com/codeshare/3b5c66d6-ed5b-46a0-8dc6-3a48cc76a482

\

更新时间:2023-08-03 06:02

54th Meetup:定时任务让高频因子自动转起来

研报及源码

【方正金工】成交量激增时刻蕴含的alpha信息——多因子选股系列研究之一

视频讲解

https://www.bilibili.com/video/BV1pW4y1X7Ds/

更新时间:2023-08-02 05:59

高频数据的微观划分

20210322-长江证券-基础因子研究(十七):高频因子(十一),高频数据的微观划分.pdf

  • 交易微观结构,即通过高频量价数据的刻画,区分出不同交易性质的时间段
  • 交易活跃度不同的区间,价格变动呈现不同的趋势效应,价格波动呈现不同的风险属性
  • 根据因子收益来源直接进行结构划分可以更好的做到信息的提纯,改进因子表现
  • 当同划分逻辑在因子改进上呈现相反结果时,说明某种划分下有增量信息可以提纯


[/wiki/static/upload/04/040703f9-7b3e-4b99-aaeb-98f5d4215274.pdf](/wiki/st

更新时间:2023-06-13 06:53

高频因子在不同周期和域下的表现及影响因素分析-海通-191121

摘要

在前期报告中,我们从交易逻辑出发,使用分钟、tick以及逐笔数据构建了一系列高频因子,在2019年5月发布周报样本外跟踪以来,取得了优异稳定的表现。

在本篇报告中,我们将考察高频因子在不同周期和域下的表现,以及分析影响因子表现的因素。

正文

/wiki/static/upload/2e/2e0b73a2-fb2e-44db-8e77-90dda5547b24.pdf

\

更新时间:2023-06-03 02:06

高频因子:分钟单笔金额序列中的主力行为刻画

摘要

在本报告中,我们将继续探讨逐笔成交数据的Alpha潜力,报告内容包含两部分:第1部分,从分钟单笔成交金额的分布特征、时序特征、反转效应三个维度出发,提炼有效的价量因子;第2部分,测试因子在主要宽基指数和行业赛道上的选股效果。

从分钟单笔成交金额中提炼选股因子

分钟单笔成交金额的分布包含更加细化的选股信息,从单笔成交金额的分组统计结果来看,其信息分布并不是均匀的,我们基于这一现象捕捉Alpha,构造了一系列统计指标因子,如分位数、标准差、偏度和峰度。以分位数因子为例:

(1)因子表现:Rank IC为-0.072,Rank ICIR达到3.57,具备稳定有效的选股能力

更新时间:2023-06-01 14:28

日内与日间 长江证券-20210606

20210606-长江证券-基础因子研究(十八):高频因子(十二)日内与日间

  • 高频数据在构建因子中计算方式的选择,取决于两个逻辑;不同交易周期量价信息的表达是否一致,微观结构是否有信息增量
  • 当微观结构有信息增量时,整体法是计算高频因子更广适的方法
  • 综合过去一段时间个股日内属性的信息的方法是日内的拓展
  • 不同频率相对未来不同时间窗口,价格变动呈现不同的动量反应


[/wiki/static/upload/af/af7aa295-f53d-4442-ade7-93f5ffa05799.pdf](/wiki/static/upload/af/af7

更新时间:2023-06-01 14:28

基于逐笔成交数据的高频因子梳理-海通证券-20200223

摘要

在系列专题报告《选股因子系列研究(五十六)——买卖单数据中的Alpha》、《选股因子系列研究(五十七)——基于主动买入行为的选股因子》、《选股因子系列研究(五十八)——知情交易与主买主卖》中,我们从不同的角度对于逐笔成交数据中的信息进行了挖掘,并得到了一些具有显著选股能力的因子。本文旨在对于筛选得到的有效因子进行梳理。

逐笔因子在正交后具有显著的全市场月度选股能力。因子月均IC在0.03~0.04之间。正交后的各逐笔因子皆呈现出了较强的稳定性。除了买单集中度之外,其余因子年化ICIR皆超过2.0。

指数范围会对因子选股能力产生影响。在中证800指数内,大买成交金额占比、盘中

更新时间:2023-06-01 14:28

高频因子在不同周期和域下的表现及影响因素分析-海通证券-20191113

摘要

在前期报告中,我们从交易逻辑出发,使用分钟、tick以及逐笔数据构建了一系列高频因子。在本篇报告中,我们将考察因子在不同周期和域下的表现,以及分析影响因子表现的因素。

高频因子计算方法

我们基于交易逻辑和投资者行为构建了高频偏度、下行波动占比、改进反转、尾盘成交占比、量价相关性、平均单笔流出金额占比、大单推动涨幅、成交委托相关性以及收盘前成交委托相关性等高频因子。因子计算方法相对统一:使用每日日内信息计算得到指标,取指标N日均值或累计值作为因子值。

月频调仓下的因子表现

在全市场中,绝大多数因子月均多空收益差在1.5%以上,rank IC均值在7%以上,其

更新时间:2023-06-01 14:28

高频数据在行业轮动中的应用-海通证券-20180425

摘要

在前期发布的行业轮动专题报告中,我们对于有效的行业轮动因子进行了总结,部分基本面因子存在较好的行业轮动能力。然而,对于技术类行业轮动因子,我们并未得到较好的结果。

本文从高频数据的角度出发,借鉴因子选股报告中的高频因子构建行业高频因子,并对于相关因子的行业轮动能力进行了回测。本文主要分为四部分,第一部分介绍了相关因子的逻辑以及计算方法,第二部分对于各高频因子的月度行业轮动能力进行了回测分析,第三部分变换了模型参数,对于相关因子的行业轮动能力进行了敏感性测试,第四部分展示了2017年以来相关因子所选出的多头行业。

可参考高频数据类选股因子构建高频数据类行业轮动因子。考虑到使用日

更新时间:2023-06-01 14:28

高频因子:高阶矩高频因子

摘要

系列报告以量价数据为主构建高频因子高频因子的构建方式划分为三大类:单维度单层次,即仅使用量或价维度中的单一数据;多维度单层次,即综合量、价维度中各自的单一数据;多维度多层次,即综合量、价维度中多个数据。本文从单维度单层次的角度,测试了收益率、成交量两个维度,一阶矩到四阶矩的因子表现。

高阶矩因子的本质为“反常”高阶矩因子收益来源于个股交易中存在的“反常”,这种“反常”又可以分为两大类:过度反应逻辑,价格被高估并在之后回归到价值附近,以收益率均值类因子、收益率标准差类因子、成交量偏度类因子为代表;交易异常逻辑,多空博弈激烈的个股收益不确定性较强,以收益率偏度类因子、收益率峰度类因

更新时间:2023-06-01 14:28

高频因子研究框架-长江证券-20190721

摘要

高频因子研究框架

高频因子需要考虑的核心问题在信息增量,除此之外,因子表现的细节问题,如行为交易逻辑、收益来源,也需要从特定角度进行考虑。研究方法以线性模型为基础,从因子统计和因子回测两个方面出发,给出统计意义和选股表现上最直接的展示。

以个股日度成交额为锚,改进流动性溢价参数

本文以个股日度成交额为锚,对流动性溢价因子中的交易金额给出改进,并将溢价估计频率提高至2分钟频率,可以提供信息上的增量。Fama-MacBeth回归t值为1.98,因子IC为8.10%,IC_IR为53.59%,相比全市场等权基准年化超额收益7.24%,净值曲线排列完全呈现线性;完全

更新时间:2023-06-01 14:28

高频因子,日内分时成交量蕴藏玄机-光大-171123

摘要

多因子系列报告之五中,我们已对集合竞价阶段的成交量占比做了详尽的解析,集合竞价成交量占比因子也具有突出的选股效果。本篇报告将分时研究成交量占比,继续挖掘日内高频数据中的有效选股因子。

股票分时成交量呈现周期性日内模式。国外股票市场的日内成交量普遍呈“U”型周期变化,即成交量在开盘和收盘阶段比其他交易时段更高,我国股市因存在午间休市,因此在下午开盘时成交量一般会存在一个小高峰,构成一个“W ”型。对股票日内的成交量分时研究,W的三个峰值前后时点的成交量值得重点关注。

不同时段成交量占比因子有效性差异明显。以5分钟为划分频率,分时研究日内49个时段的成交量占比因子,在上午10:0

更新时间:2023-06-01 14:28

海通金工-高频因子的现实与幻想

时间:2020 年 07 月 30 日

分析师:冯佳睿 袁林青 姚石 罗蕾 余浩淼

摘要

高频行情数据蕴含丰富的信息,但市场上少有对此类数据的特征及如何应用的详细介绍。本文从高频行情数据的组成和结构出发,系统整理了十几个既有经济学逻辑, 又表现良好的因子,并通过多因子指数增强模型展现其实践价值。

Level2 行情数据概况

Level2 行情数据是目前国内证券市场上对于交易信息包含最为完整,颗粒度最为精细的行情数据产品。主要有 4 种形式:分钟 K 线、盘 口快照、委托队列、成交明细。Level2 行情数据已覆盖在沪深两市上市的股票、 可交易型基金、沪深交易所指数等大量品

更新时间:2023-06-01 14:28

高频因子和交易行为-长江证券-20190810

摘要

量价组合构建高频因子往往可以带来信息增量

量价组合构建因子构建过程相对复杂,和传统量价风格因子和高阶矩因子均有一定相关性,但相关性不高,往往可以带来新的信息增量。本文给出两种量价组合构建因子的案例,其中以价格轨迹变动改进的非流动性因子在剥离了规模因子的线性影响后,全A股范围内超额收益9.70%,信息比1.55,多空收益38.19%,多空夏普比2.90。以主动买卖单构建的博弈因子,在全A股范围内超额收益4.47%,信息比0.77,多空收益26.67%,多空夏普比2.10。

高频因子刻画交易行为,获得经验收益

高频因子的局限可以从三个维度给出刻画:从因子信息上看

更新时间:2023-06-01 14:28

高频因子:流动性溢价因子-长江证券-20190408

摘要

本文基于盘口挂单数据构建流动性溢价因子以盘口的买单数据为撮合交易的基础,以插值的方式增加虚拟订单,每日得到一定交易金额下模拟交易的市值和按照均价交易的市值,取过去21天市值的总和,两者之间的相对差距即为流动性溢价因子。

流动性溢价因子可以更快地反映市场变化流动性溢价因子和传统的流动性因子呈负相关,不同参数下的因子截面相关性均值在50%到70%之间,其半衰期为72天,在前30天信息衰减速度最快,累积IC在60天基本达到最大值。不同参数下的因子IC均值在7%左右,IC_IR在0.5附近。

流动性溢价因子是一个相对有效的因子流动性溢价因子可以较为稳定地获得选股超额收益,在剥离市值因

更新时间:2023-06-01 14:28

成交量占比高频因子解析-光大证券-20170901

摘要

随着定价模型的深入研究,因子的覆盖范围也不断拓宽。技术引领金融数据不断创新,市场的有效性逐渐增强,承载着更多信息的高频数据因子应运而生。在金融市场中,由于交易的连续性,信息对股票价格的影响是连续的,数据采集的频率越高,更能全面真实地刻画市场微观结构。本文从市场微观结构出发,构造了有别于低频因子的有效选股因子——集合竞价成交量占比

集合竞价阶段是反映投资者行为信息的重要时点。我国股票的日内交易分为集合竞价阶段和连续竞价阶段,累计交易时长4小时。开盘和收盘是一天中股市交易的最重要的阶段,开盘集合竞价阶段是隔夜信息释放的第一时点,而收盘集合竞价阶段则是日内交易信息反映的最后时点。集合

更新时间:2023-06-01 14:28

高频漫谈

导读


  • 近一年以来,许多公募中证500指数增强型基金的超额收益表现十分优异,其中部分表现优异的基金呈现出高换手的特征,这与采用高频因子的私募指数增强型基金的表现十分相似。许多基金业绩也证明,采用高换手取得高收益是可接受的,受此启发,我们认为高频因子是探寻基金业绩增长的一条可行路径。
  • 高频因子一般基于level2数据构造,显著的特点是IC半衰期小于低频因子,因此需要更频繁的换手以捕捉高频信息,获得不同于低频因子的高额收益。我们认为高频因子构造的思路在于寻求独立同分布变量中不变的统计特征,基于数据所含信息角度,我们提出了4种高频因子分类方法,希望在未来通过面向统计

更新时间:2023-06-01 14:28

分页第1页第2页