【研报分享】长江证券:结构化反转因子

反转因子
标签: #<Tag:0x00007f5b9ecbf808>

(hu1996) #1

高频因子(二):结构化反转因子

报告要点

 基础反转因子有一定选股能力
以 21 天收益率构建的基础反转因子是目前最常用的反转因子,可以获得年化1.10%的超额收益率和 0.16 的信息比,有一定的选股能力,但波动较大,回撤年份多,且分组线性性不佳。在剥离了流动性和波动率因子的线性影响后,年化超额收益为-0.19%,信息比为 0.00。

 高频反转因子显著增强了反转效应的选股能力
以成交量加权合成的高频反转因子显著提升了基础反转因子的选股能力。其平均 IC 为-0.09,IC_IR 为 1.01,可以获得年化 5.98%的超额收益和 0.98 的信息比,因子的收益能力和稳定性均有显著提高。除第 1、2 组外,净值分布严格以因子分组结果呈线性排列。在剥离了流动性和波动率因子的线性影响后,年化超额收益为 2.84%,信息比为 0.46。

 结构化反转因子进一步增强了反转效应的选股能力
在以高频数据构建结构化反转因子时,同时考虑了个股的动量效应和反转效应,进一步提升了基础反转因子的选股能力。其平均 IC 为-0.09,IC_IR 为 1.00,可以获得年化 7.21%的超额收益和 1.31 的信息比,因子的收益能力和稳定性均有显著提高,且净值分布严格以因子分组结果呈线性排列。在剥离了流动性和波动率因子的线性影响后,年化超额收益为 3.65%,信息比为 0.64。

 个股反转效应和动量效应临界点与市值相关
个股动量效应与反转效应的核心在于哪些变量会影响个股交易时多空双方博弈的激烈程度,市值较大的个股多空博弈的程度较小,投资者更倾向于基本面定价,动量效应阈值较低。

 反转类因子的收益能力和市场波动相关
反转效应的核心在市场信息传递的滞后性和投资者过度反应的程度,前者保证了反转效应的存在,后者保证了反转效应的收益,而过度反应的表现即为市场波动,在市场波动较大时反转类因子的收益能力增强。

目录

反转因子启示
反转因子窥探
高频反转因子构建
反转的本质
为何反转
反转因子的通式和因子构建
因子性质
因子回测
全 A 股
中证 800
结构化反转因子
反转类因子在头部区分的思考
结构化反转因子构建
因子性质
因子回测
全 A 股
中证 800
思考
总结

图表目录
图 1:全 A 股基础反转因子回测净值
图 2:中证 800 基础反转因子回测净值
图 3:沪深 300 指数 k 线图
图 4:高频反转因子截面相关性
图 5:高频反转因子 IC 时间序列
图 6:基础反转因子半衰期
图 7:高频反转因子半衰期
图 8:全 A 股高频反转因子回测净值
图 9:全 A 股基础反转因子回测净值(中性后)
图 10:全 A 股高频反转因子回测净值(中性后)
图 11:中证 800 高频反转因子回测净值
图 12:中证 800 高频反转因子回测净值(中性后)
图 13:格力电器 k 线图
图 14:乐视网 k 线图
图 15:全 A 股结构化反转因子回测净值
图 16:全 A 股结构化反转因子回测净值(中性后)
图 17:中证 800 结构化反转因子回测净值
图 18:中证 800 结构化反转因子回测净值(中性后)
图 19:波动率与因子收益(单位:%)

表 1:基础反转因子风险指标
表 2:全 A 股基础反转因子分组年化收益
表 3:中证 800 基础反转因子分组年化收益
表 4:高频反转因子与量价风格因子相关性
表 5:高频反转因子统计
表 6:全 A 股高频反转因子风险指标
表 7:全 A 股高频反转因子分组年化收益
表 8:全 A 股基础反转因子、高频反转因子风险指标(中性后)
表 9:中证 800 高频反转因子分组年化收益
表 10:中证 800 高频反转因子风险指标
表 11:结构化反转因子与量价风格因子相关性
表 12:结构化反转因子统计
表 13:全 A 股结构化反转因子分组年化收益
表 14:全 A 股结构化反转因子风险指标
表 15:中证 800 结构化反转因子风险指标
表 16:中证 800 结构化反转因子分组年化收益
表 17:以市值分组落入反转分组条件频率
表 18:市场分年波动率及反转类因子表现(单位:%)

反转因子启示

反转效应是由投资者的交易行为引发的市场现象,表现为过去上涨较多的股票会在未来一段时间有一定的回调,而过去下跌较多的股票会在未来一段时间呈现一定的反弹。

反转效应的核心逻辑在于市场信息传递的滞后性以及投资者的过度反应,资产的价格围绕其价值波动,在局部时间段存在定价偏差,但资产的价格最终会回归到其价值上,故过去涨幅较大的股票在未来收益会受到一定程度上的限制,而跌幅较大的股票在未来收益则会有一定程度的加强。错误的定价产生投资机会,反转因子的构建即基于反转效应带来的可套利空间。
首先给出本文中的回测规则:

股票池:剔除 ST 及上市不足一年的股票,剔除过去 20 个交易日停牌超过 10 天的股票。
回测区间:2005-01-01 至 2019-05-23(中证 800 为 2007-02-01 至 2019-05-23)。
调仓设置:月度调仓,每个月底根据因子值从低到高(反转因子值越低,股票相对表现越好)将股票分为 10 组(中证 800 为 5 组),在下一个交易日按收盘价调仓,每组内的股票等权配置,交易成本双边 0.15%。
基准:全 A 范围内为全 A 股票月度等权组合,中证 800 范围内为中证 800 价格指数。

反转因子窥探

A 股市场个人投资者多,对市场变化更容易做出过度反应,导致股市波动较大,这也是反转因子在 A 股市场相比于大部分风格因子,过去很长一段时间表现较好的原因。目前反转效应在中期维度更为明显,故本文以个股过去 21 天收益率作为基础反转因子,首先给出因子在全市场和中证 800 范围内分组回测的表现。图 1 和图 2 给出了基础反转因子分组回测的净值曲线,表 1 和表 2 给出了基础反转因子每组分年及整个时间段的年化收益,表 3 给出了基础反转因子选股第 1 组的风险指标,可以得到以下结论:

 整体来看,基础反转因子有一定的区分能力,在全 A 股和中证 800 内头部组均可以获得相对稳定的超额收益。
 纵向比较,从多空收益的角度,基础反转因子出现明显回撤的年份为 2013 年、2014 年和 2017 年,这一点在全市场和中证 800 内表现相对一致。
 横向比较,基础反转因子在全 A 股和中证 800 内均有较好的表现,但从多空比价曲线的平滑性及多空收益风险比的角度看,中证 800 内选股的波动更大。
 从分组情况来看,最终净值分布基本以因子的分组结果呈现线性排列,但在头部组存在“U”型情况,即在全 A 股中第 2、3 组表现更好,在中证 800 中第 2 组表现更好。更进一步,除回撤的年份,分组选股收益在全 A 股和中证 800 内基本呈现线性,在中证 800 内第 1 组在 2009、2010、2012 和 2015 年均为全组最高,但在全 A 股内第 1 组仅在 2012 和 2015 年为全组最高。



总结本节统计结果:
 简单以过去 21 日收益率构建的基础反转因子有一定的选股能力。
 基础反转因子选股波动较大,回撤年份较多,尤其在中证 800 范围内。
 反转因子的分组线性性不佳。
针对以上三点,本文从高频数据出发,对基础反转因子给出改进。

高频反转因子构建

反转的本质

反转因子投资的核心逻辑为均值回归,重点在投资者对市场变化的过度反应导致资产价格的局部错误定价,而什么样的价格变动更容易修复,什么样的价格变动较难回归,会直接影响到构建的反转因子的表现,这一点可以从之前市场中的交易行为寻找有用信息。

为何反转

价格的变动伴随着投资者的交易行为,成交的活跃程度影响价格变动的性质。在分析成交活跃度时,将其分为被动成交活跃度和主动成交活跃度:

 被动成交活跃度是指当前市场环境下个股的成交水平中枢,主要和当前市场整体水平和个股特质有关,如牛市时个股成交水平会显著提升,大市值股票的成交较小市值股票会更为活跃。从时间维度上看,被动成交活跃度会有阶段性变化,但中短期内变化缓慢。

 主动成交活跃度是指在一段时间区间内由于事件、情绪波动等影响,引发个股成交水平在当前中枢上的获得脉冲增量(可以为负),如利好消息带来的放量上涨,股价停滞上行导致的缩量盘整。从时间维度上看,主动成交活跃度构成了局部交易行为的差异。

从交易行为角度出发,市场交易的本质在于多空双方的力量对比,博弈状态会直接影响反转效应的强弱,当一方力量明显压过另一方时,价格变动往往具有较强的不可逆性,直到双方力量再次达到一个动态平衡标志价格进入一个博弈区间。主动成交活跃度(即中短期的相对成交量)可以衡量市场在交易层面多空力量的博弈激烈情况,成交越活跃,双方博弈越强。

图 3 给出了中证 500 指数在 2010-07-07 到 2011-06-17 期间的日 k 线图走势,图中以红色框圈出了指数的上升阶段,并可以根据成交活跃程度分为量段区间:
 2010-07-07 至 2010-09-16 为第一阶段,被动成交活跃度在 109 亿以下,且上升的前半段主动成交量小于调整的后半段主动成交量,即上升区间主动成交活跃度较低,双方博弈较弱,指数在到达新的价格中枢后进入了较长时间的盘整,点位没有明显回落。
 2010-09-17 至 2010-12-29 为第二阶段,被动成交活跃度在 109 亿以上,且上升的前半段主动成交量小于下降的后半段主动成交量,即上升区间主动成交活跃度较高,双方博弈较强,在到达新的价格中枢后很快回落。

4

所以一般来说,主动成交活跃度越高,双方博弈越激烈,价格不确定性越强,价格变动具有较强可逆性,即局部成交量越高,价格变动越容易反转。价格在变动时成交量较小,市场的预期相对一致,价格变动往往是不可逆的;而如果价格的变动伴随着较高的换手,市场的多空双方博弈激烈,价格更容易偏离其正常水平,后期更容易反转。针对这一现象,可以从相对高频的数据口径下,以成交量为另一变量对基础反转因子给出改进。

反转因子的通式和因子构建

在改进基础反转因子之前,首先要对反转因子在数学上的通用形式给出表达。基础反转因子的计算方式为过去 21 天收益率,本质为 21 天日度累计涨跌幅,表达式如下:

5

可以看出,基础反转因子为综合过去 21 天价格变化信息,给出其对数的等权加和。针对此构造方式,可以给出两个维度的改进:加权的维度。量价因子最广义的变化即为针对信息综合的形式,给出相应的加权方式,如从时间维度出发,按照时间序列排序加权求和。下式展示了以半衰期的时间尺度加权方式,构造反转因子的表达通式,其中 𝑤𝑖为每日价格变动的加权方式,𝜏为半衰期。

6

时间段划分的维度。传统量价因子在构建时多以日度数据为基础,如波动率因子以日度收益率计算标准差,而低频的数据往往损失较多信息。对于基础反转因子来说,简单的使用过去一段时间的总累计收益率只用到了交易的结果数据,并没有利用到交易的过程数据,故可以适当提高数据频率实现信息的表达。下式展示了以更高频的时间段划分方式,构造反转因子表达通式,即为广义上反转因子的通式,其中𝑝𝑒𝑟𝑖𝑜𝑑为过去一段时间按一定规则划分时间段的总时间段个数,𝑤𝑖为每个时刻价格变动的加权方式。

7

本文基于反转效应在交易行为上的体现,即成交越活跃价格容易反转,给出按成交量加权的高频反转因子构建方式,如下式:

8

下面给出 10 分钟频率、30 分钟频率和 60 分钟频率高频反转因子的相关分析,以及 10分钟频率下因子的表现,如无特指,下文中高频反转因子即指 10 分钟频率下的高频反转因子。

因子性质

首先从与风格因子相关性、因子 IC 和因子半衰期上,给出因子性质的讨论。以高频量价数据构建的因子,和传统的风格因子中量价因子相关性较高,这里我们选取了市值、波动率、流动性和基础反转因子,与构建的 3 个高频反转因子做相关性上的展示,结果如表 4 所示。可以得到以下结论:
 高频反转因子和基础反转因子相关性较高,且随着数据的频率降低,相关性在增加。
 和基础反转因子相比,高频反转因子和波动率及换手率的相关性更高。
 反转类因子和市值因子均无明显相关性。

9

图 4 和图 5 展示了基础反转因子和高频反转因子(三个频率)自身截面相关性和 IC 时间序列。为检测反转类因子信息衰减的速度,计算了月末因子值与接下来每 10 个交易日收益率的 IC 情况,拟合得到各个因子的半衰期,并根据 Grinold 的理论,将半衰期带入公式10 ,其中𝛿为衰减系数,得到拟合累积 IC 曲线。图 6 和图 7 分别给出了基础反转因子和高频反转因子的半衰期图。最后表 5 给出了因子 IC 和半衰期的相关统计。可以得到以下结论:
 不论是自身的截面相关性还是 IC 值,时间序列上基础反转因子的波动均高于高频反转因子(三个频率),这点也可以从因子 IC_IR 的显著差别上体现。
 高频反转因子(三个频率)数据频率越高,自身截面相关性越高。
 高频反转因子(三个频率)的 IR 在-0.09 之上,比基础反转因子高出近 2 个百分点,IC_IR 在 1 左右,相比基础反转因子得到显著提升。
 高频反转因子(三个频率)的测算的半衰期显著高于基础反转因子,但从散点图的分布上可以看出,基础反转因子的 IC 序列不稳定。



13

因子回测

本章探讨高频反转因子在全 A 股和中证 800 范围内的表现。

全 A 股

图 8 给出了全 A 股高频反转因子分组回测的净值曲线,表 6 给出了高频反转因子每组分年及整个时间段的年化收益,在表 7 中给出了高频反转因子选股第 1 组的风险指标,可以得到以下结论:
 整体来看,高频反转因子有较好的区分能力,头部组可以获得相对稳定的超额收益。
 从分组情况来看,除第 1、2 组外,最终净值分布严格以因子分组结果呈线性排列。更进一步,除 2014 和 2017 年,分组选股收益基本呈现线性,第 1 组在 2006 年、2008 年、2010 年、2012 年均为全组最高。
 和基础反转因子相比,高频反转因子可以获得更高的超额和多空收益表现,且收益风险比更高,多空比价曲线走势更为平缓。高频反转因子在 2013 年未出现回撤,且回撤的年份负超额收益显著减小。

14


在构建高频反转因子的过程中,用到了成交量进行价格变动的加权求和,故新的因子会受到交易层面如流动性和波动率的影响,在因子统计一节的统计中也可以看到,和基础反转因子相比,高频反转因子与其相关性更高,故为了排除其影响,分别对基础反转因子和高频反转因子做对换手率因子和波动率因子的中性化处理,给出选股结果的比较。

图 9 和图 10 分别给出了中性后基础反转因子和高频因子分组回测的净值曲线,表 8 给出了因子选股第 1 组的风险指标,可以得到以下结论:
 整体来看,高频反转因子可以获得更高的超额和多空收益,信息比和多空夏普比均有显著提升,且多空比价 10 分钟高频因子更为平滑。
 从分组结果上看,高频反转因子仅在第 1、2 组没有按照因子的分组结果线性顺序,而基础反转因子前五组均存在错位情况。


中证 800

本节针对高频反转因子,在中证 800 范围内给出回测结果,图 11 和图 12 分别给出了高频反转因子中性前后分组回测的净值曲线,表 9 给出了高频反转因子每组分年及整个时间段的年化收益,表 10 给出了高频反转因子中性前后选股第 1 组的风险指标,可以得到以下结论:

 整体来看,中性前后高频反转因子均可获得较为稳定的超额收益,仅 2014 年有多空收益上的回撤;中性后因子的表现有一定下降。
 从分组情况来看,最终的净值分布严格按照因子的分组结果呈线性排列,除 2014年和 2017 年,分组选股收益排序基本呈现线性。
 和基础反转因子相比,在中证 800 内高频反转因子可以获得更高的超额和多空收益表现,且收益风险比更高,多空比价曲线走势更为平缓。从多空上看,高频反转因子仅在 2014 年出现明显回撤,相比基础反转因子多出的 2013 和 2017 年有显著提升。



总结本节统计结果:
 高频反转因子相比于基础反转因子,截面变化更为稳定。
 高频反转因子相比于基础反转因子,在全 A 股范围内和中证 800 范围内,在相对换手率因子和波动率因子中性前后,均有更好表现。
 在全 A 股范围内,高频反转因子除第 1、2 组外,净值分布严格以因子分组结果呈线性排列,在中证 800 范围内,净值分布严格以因子分组结果呈线性排列。

结构化反转因子

以成交量加权构建的高频反转因子可以很好的提升反转效应获取超额收益的稳定性,头部组可以获得更高的超额收益,且收益风险比也有较大改善,在分组的线性区分度上也有一定的提升,但在头部组的区分上仍存在第 2 组表现比第 1 组表现更好的情况。针对这一问题,本节加入动量效应的讨论,尝试构建结构化反转因子。

反转类因子在头部区分的思考

反转效应的关键在于股票价格存在错误定价,所以最终会回归到其内在价值,即要求股价的变动是围绕其真实价值产生的波动。而实际情况股价的变动本身就包含了价值和价格两个部分的变化,其中价格变化由于均值回归的特性,产生了反转效应;而价值的变化由于本身就是正确的定价,存在不可逆性,甚至在信息传递存在滞后的情况下产生了动量效应。

在上文的讨论中,都只考虑了中短期的反转效应,而实际上对于个股来说反转效应和动量效应在短期内皆存在,只是由于 A 股市场波动较大的特点,导致反转效应一直为全市场的主矛盾,即为绝大多数个股的主矛盾,但依然存在动量效应为主矛盾的个股。回到反转因子头部区分的问题,高频反转因子除了第 1、2 组外,分组净值均按照因子值呈线性排列,关键问题在第 1 组本质上为股价负向变动程度最大的组,这种价格变动的幅
度会同时正向增强个股的反转效应和动量效应:
 反转效应的增强即体现在以反转为矛盾的个股在未来有更大幅度的反弹,组合相比于基准可以获得更为显著的超额收益;
 动量效应的增强即体现在以动量为矛盾的个股在未来有更强的下跌趋势,最终拖累组合的收益,导致收益能力不如第 2 组。

在“反转的本质”一节中,我们从多空博弈的角度,给出了在一段时间区间内,成交量越高反转效应越强的结论,更进一步,不论是多空双方博弈的力量对比还是成交量的局部差异,本质都是信息在股市中传递展现的结果,核心还在有多少信息伴随着交易行为被市场消化。这里以一字板的特例来推演从信息到多空博弈,最终到价格变动的逻辑。图 13 和图 14 分别给出了格力电器和乐视网局部 k 线图:

 2019-04-01 格力电器发布了计划股权变更的停牌公告,并在 2019-04-09 重新复牌,复牌当日,利好消息以开盘一字板封板涨停的形式被市场迅速消化,多头力量呈压倒性优势,在成交量很小的情况下价格迅速打到当时的合理价位;随后在2019-04-10 到 2019-04-19 的时间段,伴随着放量上涨,信息进一步释放,多空双方力量逐渐均衡,并在之后开始回调,到达最初信息释放时的价格中枢。

 2018-01-24 乐视网在乐视事件发酵后的首日复牌,在接下来的 11 个交易日,利空消息以开盘一字板封板跌停的形式被市场迅速消化,空头力量呈压倒性优势,在成交量很小的情况下价格迅速打到当时的合理价位;随后在 2018-02-08 到 2018-04-16 的时间段放量调整,进入多空双方博弈期,并在初期仍展现出一定的下跌韧性,直到力量均衡后,达到最初信息释放时的价格中枢。

可以看出,不论是上涨还是下跌,在新的信息进入市场时会被迅速消化,多空力量会呈现明显不均衡的状态,导致在成交很低的情况下价格迅速到达相对合理价格中枢,多空双方几乎不存在博弈,价格呈现很强的确定性,不可逆性强,并具有一定的动量效应;直到信息基本被市场消化进入到多空双方博弈期,有一个明显放量的过程,成交量提升到一个新的水平,价格不确定性增强,呈现反转效应。即局部看来,存在一个成交量的
阈值,使得小于该阈值时的价格变动呈现动量效应,大于该阈值时的价格变动呈现反转效应。

结构化反转因子构建

由上一节的分析中可知,交易层面的反转效应会和成交活跃程度相关,成交量越低反转效应越弱,且到达一定阈值后转变为动量效应。基于此特性,给出了结构化反转因子的构建:

根据一段时间内每个时间段的成交量,从小到大进行排序,以一个比例为临界点,取小于临界点的时间段作为动量时间段,记为𝑝𝑒𝑟𝑖𝑜𝑑𝑚𝑜𝑚,大于临界点的时间段作为反转时间段,记为𝑝𝑒𝑟𝑖𝑜𝑑𝑟𝑒𝑣,其中𝑝𝑒𝑟𝑖𝑜𝑑为过去一段时间按一定规则划分时间段的总时间段个数,𝑝𝑒𝑟𝑖𝑜𝑑 = 𝑝𝑒𝑟𝑖𝑜𝑑𝑚𝑜𝑚 ∪ 𝑝𝑒𝑟𝑖𝑜𝑑𝑟𝑒𝑣。
以成交量倒数加权的形式,构建动量时间段反转因子:

23

以成交量加权的形式,构建反转时间段反转因子:

24

以动量时间段反转因子和反转时间段反转因子合成结构化反转因子:Rev𝑠𝑡𝑟𝑢𝑐𝑡 = Rev𝑟𝑒𝑣 − Ret𝑚𝑜𝑚.在研究过程中,我们分别从小到大对成交量给出排序,以 10%、15%和 20%为阈值构建结构化反转因子,并在本篇报告中展现 10%的相关结果。下面给出 10 分钟频率、30分钟频率和 60 分钟频率结构化反转因子的相关分析,并给出 10 分钟频率下因子的表现,如无特指,下文中结构化反转因子即指 10 分钟频率下的结构化反转因子。

因子性质

表 11 展示了 3 个结构化反转因子和传统量价风格因子的相关性,表 12 展示了结构化反转因子 IC 和半衰期的相关统计,可以得到以下结论:
 结构化反转因子和基础反转因子仍有最高的相关性,但和高频反转因子相比,相关性进一步降低。
 结构化反转因子和波动率及换手率因子相关性较高,但和高频反转因子相比有所下降。
 结构化反转因子和市值因子无明显相关性。
 和高频反转因子(三个频率)相比,同频率下的结构化反转因子(三个频率)的截面自相关性有所增加,平均 IC 值有所下降,但 IC_IR 的表现上有一定提升,因子收益的稳定性在增加。
 结构化反转因子(三个频率)的测算的半衰期相比同频率下的结构化反转因子(三个频率)均有一定程度的下降,且频率越低,半衰期越低。

1
2

因子回测

本章探讨结构化反转因子在全 A 股和中证 800 范围内的表现。

全 A 股

本节针对结构化反转因子,在全 A 股范围内给出回测结果,图 15 和图 16 分别给出了结构化反转因子中性前后分组回测的净值曲线,表 13 给出了结构化反转因子每组分年及整个时间段的年化收益,表 14 给出了结构化反转因子中性前后选股第 1 组的风险指标,可以得到以下结论:

 整体来看,中性前后结构化反转因子均可获得较为稳定的超额收益,头部组可以获得相对稳定的超额收益,中性前因子仅在2014年和2017年有超额收益上的回撤,中性后因子仅在 2011 年、2014 年和 2017 年有超额收益上的回撤。
 从分组的线性情况来看,最终的净值分布严格按照因子的分组结果呈线性排列,除2014 和 2017 年,分组选股收益排序基本呈现线性。第 1 组在 2006 年、2008 年、2009 年、2010 年、2012 年、2013 年、2015 年均为全组最高,相比于基础反转因子和高频反转因子有显著提升。
 和高频反转因子相比,结构化反转因子可以获得更高的超额和多空收益表现,且收益风险比更高。结构化反转出现明显回撤的年份为 2014 和 2017 年,且回撤的年份负超额收益相比高频反转因子显著减小。



中证 800

本节针对结构化反转因子,在中证 800 范围内给出回测结果,图 17 和图 18 分别给出了结构化反转因子中性前后分组回测的净值曲线,表 15 给出了结构化反转因子每组分年及整个时间段的年化收益,表 16 给出了结构化反转因子中性前后选股第 1 组的风险指标,可以得到以下结论:

 整体来看,中性前后结构化反转因子均可获得较为稳定的超额收益,头部组可以获得相对稳定的超额收益,因子仅在 2014 年有多空收益上的回撤。
 从分组的线性情况来看,最终的净值分布严格按照因子的分组结果呈线性排列,除2014 年,分组选股收益排序基本呈现线性。
 和高频反转因子相比,结构化反转因子的收益能力略有下降,收益风险比有所降低。



总结本节统计结果:
 结构化反转因子相比于高频反转因子,平均 IC 有所降低,但因子收益更为稳定。
 结构化反转因子相比于高频反转因子,在全 A 股范围内,相对换手率因子和波动率因子中性前后,均有更好表现,但在中证 800 范围内结果相反。
 在全 A 股和中证 800 范围内,结构化反转因子严格以因子分组结果呈线性排列。

思考

在回测的过程中,我们注意到两点更高维度影响反转类因子表现的变量,第一个是在构建结构化反转因子时讨论的,反转类因子的选股结果往往会有第 1 组表现不如第 2 组表现的情况,是因为动量效应的存在以及极端价格变动对其的增强。但是还有一个值得注意的点,反转因子分组的头部和尾部均为极端价格变动,为何在只在反转的头部组存在分组非线性的现象?为何结构化反转因子在全市场表现有一个明显的提升,但在中证800 中的收益能力反而下降?

为此,我们统计了回测区间内,将全市场的个股分别按照反转因子和市值因子分成十组,并统计每一个市值组内股票落在各个反转组内的频率,即条件频率𝑝(反转 = 𝑖|市值 = 𝑗),其中𝑗为行数,𝑖为列数,结果如表 17 所示,其中市值第 1 组和反转第 1 组均为最小值组。可以看到在市值最小组,个股多聚集在反转因子的头部组,即跌的最多的部分,在尾部组即涨的最多的部分比例较少,而市值最大组则相反。

9

仍然从多空博弈的角度看,小市值组更容易针对价格进行投机套利交易,而大市值则更倾向从公司基本面角度给出定价,故同样水平的成交活跃程度,小市值股票价格不确定性更强,也更容易反转。故在针对动量效应和反转效应的最优阈值确定时,或许和市值相关。

除此之外,我们还发现对于反转因子,在特定的 2014 年和 2017 年相比于基准均存在明显回撤。反转因子的收益基于反转效应,在“反转因子启示”一章中我们指出反转效应的两点核心逻辑,其中市场信息传递的滞后性保证了反转效应的存在,投资者的过度反应保证了反转效应的收益,所以对于个人投资者居多、市场交易活跃的 A 股市场,反转因子才有较好的选股表现。故我们计算了中证全指每年的波动率作为市场波动的代理变量,并和反转类因子收益分年情况在表 18 中给出展示,并以绿色标注了市场波动较小的年份,以红色标注了市场波动较大的年份。可以看到,在市场波动率最低的两年,高频反转因子和结构化反转因子的收益为历史最低,在市场波动率最高的三年,高频反转因子和结构化反转因子的收益为历史最高。

为得到更偏统计的结果,在图 19 中我们以市场波动率为自变量,以反转类因子收益为因变量,给出线性回归结果,其中高频反转因子和结构化反转因子的拟合优度高达 65%和 70%。

11

基于以上统计结果:
 结构化反转因子的阈值设定和市值相关。
 反转类因子收益的核心来源在市场波动,相比基础反转因子,高频反转因子和结构化反转因子更能体现反转效应的核心逻辑。

总结

本文基于反转效应的深层逻辑,以高频数据改进了基础反转因子,在全 A 股范围内及等权组合及基准的标准下,得到以下结论:以 21 天收益率构建的基础反转因子是目前最常用的反转因子,可以获得年化 1.10%的
超额收益率和 0.16 的信息比,有一定的选股能力,但波动较大,回撤年份多,且分组线性性不佳。在剥离了流动性和波动率因子的线性影响后,年化超额收益为-0.19%,信息比为 0.00。

以成交量加权合成的高频反转因子显著提升了基础反转因子的选股能力。其平均 IC 为0.09,IC_IR 为 1.01,可以获得年化 5.98%的超额收益和 0.98 的信息比,因子的收益能力和稳定性均有显著提高。除第 1、2 组外,净值分布严格以因子分组结果呈线性排列。在剥离了流动性和波动率因子的线性影响后,年化超额收益为 2.84%,信息比为 0.46。

同时考虑个股的动量效应和反转效应构建的结构化反转因子进一步提升了基础反转因
子的选股能力。其平均 IC 为-0.09,IC_IR 为 1.00,可以获得年化 7.21%的超额收益和1.31 的信息比,因子的收益能力和稳定性均有显著提高,且净值分布严格以因子分组结果呈线性排列。在剥离了流动性和波动率因子的线性影响后,年化超额收益为 3.65%,信息比为 0.64。

个股的反转效应和动量效应临界点和个股性质相关,核心在于哪些变量会影响个股交易时多空双方博弈的激烈程度,如市值较大的个股多空博弈的程度较小,投资者更倾向于基本面定价,动量效应阈值较低。

反转类因子的收益能力和市场波动相关,核心在于投资者过度反应的程度,在市场波动较大时反转类因子的收益能力增强。

作者:长江证券金工团队