BigQuant 2026年度私享会

高频因子投研系列 -- 基于日内相对成交量熵的因子构建

由yangduoduo05创建,最终由yangduoduo05 被浏览 3 用户

全市场股票的日内成交量分布总体呈现U型结构,即早盘开盘后的交易相对较为活跃,临近中午收盘时交易量明显下降,下午开盘后逐步回升,并在临近全天收盘时恢复活跃。但就具体个股而言,由于不同股票的交易群体、个股的基本面或技术面信息、盘中可能带来潜在影响的信息等均不相同,因此个股的交易量分布呈现一定的差异性,如下图所示。




个股日内交易量的分布特征隐含了一定的交易信息。举例来说,假设股票A的日内交易量分布特征与全市场分布几乎一致,那么我们可以认为股票A在当天交易中几乎没有出现过因突发信息或噪音引发的脉冲式交易,其交易节奏基本跟随了市场本身。假设股票B的交易量分布呈现明显的波浪形态,我们可以认为在当天的交易中,股票B可能出现了一定的信息影响或集中交易。

为了更为清晰的刻画不同股票的日内交易量分布的特异性,我们将每只股票每分钟的交易量与全市场所有股票这一分钟交易量的比值,作为该股票的相对成交量。如下图所示,从股票A和股票B的相对成交量来看,股票A的相对交易量更为均匀,更接近市场本身的交易节奏,而股票B则在盘中出现了几次明显的相对放量交易。



我们按照如下步骤来计算成交量分布熵值因子:

\n


1)计算每分钟个股的成交量日内占比;

3)计算截面每分钟股票截面占比均值;

4)计算每分钟个股成交量相对占比变化 f1。

5)上述逻辑中我们提到熵值越小,表明越有可能是信息驱动的交易,这类股票通常可能存在较高的反应过度风险,而熵值越大的股票,表明跟随市场越明显,这类股票缺乏有效信息推动,短期内获取超额收益的难度也相对较大。因此我们认为适当合理的熵值可能更佳。我们对上述得到的熵值因子,进行均值距离化处理(减去截面均值取绝对值)。

6)根据过去20日的f1分布熵值因子



https://bigquant.com/codesharev3/02ade7be-9651-4385-a1cd-aee92610665b







\

{link}