量化数据分析

研报复现:【光大证券】多因子系列报告之五:见微知著,成交量占比高频因子解析

由hxgre创建,最终由hxgre 被浏览 118 用户

一、研报解读

**集合竞价阶段是反映投资者行为信息的重要时点。**我国股票的日内交易分为集合竞价阶段和连续竞价阶段,累计交易时长4 小时。开盘和收盘是一天中股市交易的最重要的阶段,开盘集合竞价阶段是隔夜信息释放的第一时点,而收盘集合竞价阶段则是日内交易信息反映的最后时点。集合竞价阶段遵从价格优先、时间优先的原则,投资者根据股票前日收盘价及其对当日股价的心理预期输入申报价格。一般而言,集合竞价阶段成交量反映了多空双方对个股开盘价格的认同度。

**价走量先行,集合竞价成交量占比因子选股能力突出。**集合竞价阶段的交易数据是日内高频数据的特有部分,我们以成交量为切入点,以相对指标个股集合竞价成交量占比为日内高频指标,采用技术分析中最常用指

标构造方式——简单移动平均(MA)构造开盘集合竞价成交量占比因子OCVP。同时考虑信息的时间衰减效用,引入具有时变效用的权重修正OCVP 因子。经过检验OCVP 因子具备良好的预测能力和单调性,其IC均值为-5.6%,IR 绝对值为0.83。

**叠加尾盘效应的复合因子选股能力显著提升。**考虑到收盘前阶段为日内信息传递到当日交易的最后时点,我们纳入收盘前5 分钟成交量占比因子,通过加权方式构造复合因子 OBCVP。最优权重组合下,复合因子的预测性和单调性显著提升,IC 均值为-7%,IR 绝对值大于 1。根据因子值将股票等分 5 组的多空对冲组合 8 年年化收益为 15.10%,夏普比率达3.03,最大回撤为10.2%。

开盘集合竞价成交量占比的因子的构造公式如下:

集合竞价成交量属于日内高频数据,根据信息传递过程中的衰减规律,距离指标因子计算日的时间越长其信息的时效性也会随之递减,因此我们进一步考虑引入具有时变效用的权重因子𝑤𝑖修正原始的OCVP 因子。指数移动平均(EMA)也是理想的趋势抓取工具,相比于简单移动平均,它赋予最近期信息的权重最大,也不摒弃远期信息,只是赋予呈指数式衰减的权重。

尾盘效应的代理变量计算公式如下:

下图展示了研报中OCVP和BCVP的因子检验结果。整体来看,OCVP因子具备良好的单调性,分层效应显著,多空组合年化收益约11.50%,夏普比率为1.98,最大回撤达19.5%;BCVP因子单调性较差,因子值最大组显著跑输其余组别,多空组合年化收益约12.40%,夏普比率1.12,最大回测为14.5%。

最后,基于OCVP因子和BCVP因子,我们构建成交量占比复合因子(OBCVP)

下图为OBCVP因子的单因子分析结果:分组效果很好,分组收益区分度明显;多空组合即第一组对冲第五组年化收益约15.10%,夏普比率达3.03,最大回撤为10.2%。

二、数据源

BigQuant 平台构建了集合竞价相关的因子数据:cn_stock_factors_auction,表链接为:https://bigquant.com/data/datasources/cn_stock_factors_auction。该表加工了开盘竞价阶段和收盘竞价阶段的多个因子数据,如:开盘竞价委托量、开盘竞价撤单量,开盘竞价涨跌停标识,隔夜涨跌幅等。

大家可以使用相关数据并反馈宝贵建议,如有需要加工的相关高频因子,也可以联系我们。

三、因子构建和回测

OBCVP因子的构建主要涉及到下列SQL代码,其中几点说明如下:

  • 指数移动平均和复合因子权重等参数根据研报中的测试结果为主。
  • 最终的OBCVP因子进行了行业和市值的中性化。
SELECT
    date, instrument,
    open_auction_trade_volume,
    volume,
    open_auction_trade_volume / volume as OCVP,
    m_avg(OCVP, 5) as MOCVP,
    m_ta_ema(OCVP, 5) as EMAOCVP,
    close_auction_trade_volume / volume as BCVP,
    m_avg(BCVP, 5) as MOCVP,
    m_ta_ema(BCVP, 5) as EMAOCVP,
    (0.91 * EMAOCVP + 0.09 * EMAOCVP) as OBCVP,
    c_neutralize(OBCVP, sw2021_level1, total_market_cap) as score
FROM cn_stock_factors_auction
PRUNE JOIN cn_stock_bar1d USING (date, instrument)
PRUNE JOIN cn_stock_valuation USING (date, instrument)
PRUNE JOIN cn_stock_factors_industry USING (date, instrument)

下图是回测期间(2020年1月1日至2024年9月10日)的回测曲线,整体来看,虽然策略收益为负,但超额收益较好持续向上。

附件

1. 代码

https://bigquant.com/codesharev3/9ae218ca-32f7-476f-bad6-a587a43bb060

2. 研报原文

/wiki/static/upload/67/67801ded-6a1c-4fbd-a484-b10107b39162.pdf

\

{link}