【研报分享】华泰证券-华泰单因子测试之换手率类因子


#1

华泰单因子测试之换手率类因子

待测因子:近 N 个月每日换手率均值、标准差,及衍生的换手率乖离率等
换手率因子是一类非常重要的风格因子,本报告中我们选取了十二个具有代表性的换手率因子进行测试,包括 turn_Nm(个股最近 N 个月日均换手率,N=1、3、6),bias_turn_Nm(个股最近 N 个月日均换手率除以最近两年日均换手率再减 1,N=1、3、6),std_turn_Nm(个股最近 N 个月的日换手率序列标准差,N=1、3、6),bias_std_turn_Nm(个股最近 N 个月的日换手率序列标准差除以最近两年的日换手率序列标准差再减 1,N=1、3、6)。经实证检验,四类因子各具特点。

换手率因子总体与市值因子呈负相关,各因子两两间正相关性很强

因市值较大的公司一般换手率不高,所以日均换手率、换手率序列标准差因子与市值因子间呈一定负相关性。经实证检验,两种衍生的换手率乖离率因子与市值因子相关性较小。各换手率因子两两之间普遍具有比较强的正相关性,与之前测试过的估值、成长、动量类因子对比,相关性显得更加突出。如果要组合使用各换手率因子构建选股模型,需要小心处理多重共线性问题。

单因子测试框架:分层回测、回归法、因子 IC 值分析

首先,我们对各换手率因子依次进行详细的分层模型回测,分析各分层组合的业绩表现和多空组合的表现,判别因子区分度、单调性、稳定性和在不同规模公司、不同一级行业间的业绩强弱。接下来我们使用回归法进行因子测试,对因子收益率序列和回归产生的 t 值序列进行统计层面上的分析。我们还计算了各因子的 IC 值序列、IR 比率,综合识别有效因子。

测试结果:传统换手率 IC 值表现佳,而换手率乖离率分层测试效果好

从分层测试的结果来看,bias_turn_1m、bias_std_turn_1m 因子各方面都表现出众,而 turn_1m、std_turn_1m 因子单调性不佳。但从回归测试的因子收益率表现和 IC 值均值、IR 比率等角度来看,turn_1m、std_turn_1m因子效果更好一些,与分层测试的结果略有出入。如果将回归方式由 WLS(流通市值平方根加权)改成 OLS,则 bias_turn_1m、bias_std_turn_1m因子效果又会强于 turn_1m、std_turn_1m 因子,这从一定程度上说明前者在大市值股票中失效程度更高。综合之前单因子测试报告的结果来看,换手率因子的效果比估值、成长因子强一些,但比动量因子稍弱。

换手率因子可考虑采用更短的样本期

我们对动量类和换手率类因子进行了样本期长度的敏感性测试,发现对换手率类因子来说,用 5 天左右长度的样本期能使回归测试中因子收益率以及 IC 值均值、IR 比率达到最佳。但对于动量类因子,样本期长度在 21~33 天附近变动时,因子会有较好表现。因此,动量因子取 1 个月左右样本期比较合适,换手率因子或可考虑采用更短的样本期。

风险提示:单因子测试结果是历史经验的总结,存在失效的可能。

换手率因子在 A 股市场实证分析

换手率因子的选取及测试框架

本文是我们的多因子系列研究第五篇,是单因子测试系列的第四篇,在多因子系列首篇报告中,我们系统地阐述了多因子模型的基本理论,详细描述了多因子模型构建的流程,从多因子系列第二篇报告开始,我们对不同的风格因子单独进行详细的研究和检验,通过综合对比评价,筛选出能持续获得稳健收益的优质因子,这正是构建多因子选股模型的关键一步。在首篇报告中我们共列出了十二类风格因子:估值因子(Value Factor)、成长因子(Growth Factor)、财务质量因子(Financial Quality Factor)、杠杆因子(Leverage Factor)、规模因子(Size Factor)、动量因子(Momentum Factor)、波动率因子(Volatility Factor)、换手率因子(Turnover Factor)、改进的动量因子(Modified Momentum Factor)、分析师情绪因子(Sentiment Factor)、股东因子(Shareholder Factor)和技术因子(Technical Factor),在前三篇单因子测试报告中,我们对估值、成长、动量以及改进的动量类因子进行了详细的测试分析,在本文中,我们将主要针对换手率类因子进行分析,找出其在二级市场不同行业、不同规模上市公司中的分布规律,并通过分层回测、回归法、计算因子 IC值等测试因子有效性。

换手率类因子主要反映的是过去一段时间内资产的流通性强弱,是一类非常重要的风格因子。本报告中将测试的因子详细列表如下:

image

如果某只股票在过去一段时间的换手率明显高于同类型股票的平均水平,则该股票可能是近期资金追逐的热门股,虽然流动性强,但风险也会相对较高。在本报告中,我们第一步将先观察换手率因子在 A 股市场的分布规律,通过分析换手率因子在不同行业及不同规模上市公司间的差异,判断在单因子回归测试中是否应该处理行业、规模因素的影响。第二步我们将建立分层模型进行回测,详细观察因子区分度、单调性等规律。第三步我们将使用回归法进行单因子测试,结合因子 IC 值分析,选出有效且稳健的因子。第四步,根据以上分析结果进行对比总结,探讨各因子的特点和优劣。

image

换手率因子的行业间差异

换手率因子在不同行业间存在显著差异。例如,计算机行业当前具有较高的日均换手率,但其日均换手率乖离率却处于低位;钢铁行业当前日均换手率不高,但其日均换手率乖离率比较大。不同行业间因子值差异十分显著,故对上市公司直接进行跨行业比较意义不大。我们选取 turn_1m、bias_turn_1m、std_turn_1m、bias_std_turn_1m 作为换手率因子的代表(因子具体定义见图表 1),计算它们在 2016/12/30 收盘时各一级行业的中位数分布规律,如下图所示。

image

上图说明了,在同一时间点,不同行业间换手率因子的水平存在明显差异。事实上,随时 间变化,同一行业的换手率因子的绝对大小和与其他行业对比的相对大小也在不断变化中。以 turn_1m 为例,在 2006 年至 2016 年间,每年末行业因子值在所有 29 个一级行业中的 排位变化如下表所示。可以看出,同估值、成长等因子类似,换手率因子在 A 股市场也存 在比较明显的行业轮动现象,比如非银行金融行业在不同年份间换手率排名变化很大,计 算机行业从 2009 年开始换手率一直较高;同时,也存在一些行业的换手率排名一直比较 稳定,如银行行业一直换手率较低。行业换手率年份间的波动,一般是当时政治、金融环 境等多重因素影响的结果。

换手率因子与市值因子的相关性

除去行业对因子存在较大影响外,上市公司的规模也是对各大类因子产生作用的潜在因素。我们在前三篇单因子测试报告中对估值、成长、动量类因子进行了详细分析,发现市值因 子与大部分估值、动量类因子具有一定相关性,但是与成长类因子间相关性不大。这里面 的逻辑也是比较明晰的,因为估值因子的计算公式里包含了总市值因素,动量因子与市值 因子的相关性反映的就是市值因子本身的 IC 值(2007 年之后一直是小盘股占上风),而 成长因子完全由财报信息计算而得,与市值因子相关性较低。对于本报告中涉及的换手率 类因子,由于大盘股一般换手率较小,所以猜测是负向关系。下面我们将进行详细计算。

image

我们针对图表 1 中列出的十二个因子,详细计算了它们从 2006 年到 2016 年(在每年最后一个交易日核算)与市值因子之间的相关系数,见上表。经观察发现,换手率类因子确实与市值因子间呈负相关关系,尤其是日均换手率和日换手率序列标准差。对于换手率衍生的乖离率类因子,其与市值因子的相关性比较小。

换手率因子间相关性分析

在本章前两个小节中,我们分析了换手率因子在不同行业的分布差异性及换手率因子与市 值因子的相关性,接下来,我们将计算各换手率因子之间的相关性。假设因子 A 和 B 之间 的月度相关系数序列为{𝐶𝑜𝑟𝑟𝑖𝐴𝐵},其中𝐶𝑜𝑟𝑟𝑖𝐴𝐵是在第i个月月末这一截面上因子 A、B 在所 有个股上的因子暴露度的相关系数,我们构造了一个相关强度指标:
image

该指标结合了因子平均相关系数和相关系数的稳定性,能够综合反映因子之间的相关情况。我们分别计算各因子两两之间在过去 36 个月(2014 年 1 月到 2016 年 12 月)内的相关强度指标,如图表 6 所示。计算过程中涉及的相关系数均值和方差详细展示在图表 7 和 8中。通过观察可以发现,各换手率因子两两之间普遍具有非常强的正相关性,与之前测试过的估值、成长、动量类因子对比,相关性显得更加突出。如果要组合使用各换手率因子构建选股模型,需要注意处理多重共线性问题。

图表 7 和图表 8 分别反映因子两两之间相关系数的平均大小和相关系数稳定性,能在图表6 数据之外提供一些补充信息。


图表 6 对于构建风格因子具有一定参考意义,因子合成时要根据相关性关系赋予各因子合理权重,在后续报告中我们将详细阐述。

单因子测试流程

在多因子系列首篇报告《华泰多因子模型体系初探》(2016.09)中,我们系统地介绍了有效因子识别(即单因子测试)的理论基础和研究思路,在多因子系列第二篇报告《华泰单因子测试之估值类因子》中我们着眼于实践过程,给出了详细的流程操作说明。为避免阅读障碍,我们此处将单因子详细测试流程再复述一遍。

回归法

回归法是一种最常用的测试因子有效性的方法,具体做法是将因子在第T期的暴露度与T +1期的股票收益进行线性回归,所得到的回归系数即为因子在T期的因子收益率,同时还能得到该因子收益率在本期回归中的显著度水平——t 值。我们的回归模型为
image

在所有截面期上,我们对因子d进行回归测试,能够得到该因子的因子收益率序列(即所 有截面期回归系数𝑋𝑑 𝑇构成的序列)和对应的 t 值序列。t 值指的是对单个回归系数𝑋𝑑 𝑇的 t 检验统计量,描述的是单个变量显著性,t 值的绝对值大于临界值说明该变量是显著的, 即该解释变量(T期个股在因子 d的暴露度)是真正影响因变量(T+1期个股收益率)的 一个因素。也就是说,在每个截面期上,对于每个因子的回归方程,我们设
image

测试模型构建方法如下:

1. 股票池:全 A 股,剔除 ST、PT 股票,剔除每个截面期下一交易日停牌的股票。

2. 回溯区间:2005-04-29 至 2016-12-30。

3. 截面期:每个自然月的最后一个交易日计算因子暴露度,与下一整个自然月的个股超额收益(以沪深 300 指数为基准)进行回归。

4. 数据处理方法:

  1. 因子暴露度的计算方法已在图表 1 中进行说明,个股换手率均取自 Wind,换手率为零的日期(即遇到停牌或类似情况)不参与平均值、标准差计算;
  2. 中位数去极值:设第 T 期某因子在所有个股上的暴露度序列为𝐷𝑖,𝐷𝑀为该序列中位数,𝐷𝑀1为序列|𝐷𝑖 − 𝐷𝑀|的中位数,则将序列𝐷𝑖 中所有大于𝐷𝑀 + 5𝐷𝑀1 的数重设为𝐷𝑀 + 5𝐷𝑀1,将序列𝐷𝑖中所有小于𝐷𝑀 − 5𝐷𝑀1 的数重设为𝐷𝑀 − 5𝐷𝑀1;
  3. 标准化:将去极值处理后的因子暴露度序列减去其现在的均值、除以其标准差,得到一个新的近似服从N(0,1)分布的序列,这样做可以让不同因子的暴露度之间具有可比性;
  4. 缺失值处理:得到新的因子暴露度序列后,将因子暴露度缺失的地方设为 0(这里解释一下,由于不同因子可能在不同个股处存在缺失值,若不对缺失值进行处理则每个单因子回归的票池并不完全相同,不同单因子回归结果的可比性较差,但如果将所有出现缺失值的个股都从回归票池中剔除,当数据源质量不佳时可能

会造成票池大幅减少,回归结果同样不可信,所以这里折中处理,将因子暴露度缺失的地方设为新序列的均值,即设为零,可视作当存在缺失值时我们认为此个股的因子值与全市场平均情况相同,即持中性看法)。

5. 回归权重:由于普通最小二乘回归(OLS)可能会夸大小盘股的影响(因为小盘股的估值等因子出现极端值概率较大,且小盘股数目很多,但占全市场的交易量比重较小),并且回归可能存在异方差性,故我们参考 Barra 手册,采用加权最小二乘回归(WLS), 使用个股流通市值的平方根作为权重,此举也有利于消除异方差性。

6. 因子评价方法:

  1. t 值序列绝对值平均值——因子显著性的重要判据;
  2. t 值序列绝对值大于 2 的占比——判断因子的显著性是否稳定;
  3. 因子收益率序列平均值,以及该均值零假设检验的 t 值——判断因子收益率序列是否方向一致,并且显著不为零;
  4. t 值序列均值的绝对值除以 t 值序列的标准差——结合显著性和波动性,辅助判断因子是否有效、稳健。

因子 IC 值的计算

因子的 IC 值是指因子在第 T 期的暴露度与 T+1 期的股票收益的相关系数,即
image

测试模型构建方法如下:

  1. 股票池、回溯区间、截面期均与回归法相同。
  2. 因子值在去极值、标准化、去空值处理后,在截面期上用其做因变量对市值因子及行业因子(哑变量)做线性回归,取残差作为因子值的一个替代。这样做可以消除行业因素和市值因素对因子的影响。计算残差序列和 T+1 期股票收益序列的相关系数作为T 期因子 IC 值。
  3. 因子评价方法:
  4. IC 值序列的均值大小——因子显著性;
  5. IC 值序列的标准差——因子稳定性;
  6. IR 比率(IC 值序列均值与标准差的比值)——因子有效性;
  7. IC 值累积曲线——随时间变化效果是否稳定;
  8. IC 值序列大于零的占比——因子作用方向是否稳定。

因子收益率、t 值与 IC 值之间的关系

前两小节分别介绍了用回归法、IC 值评价因子有效性的两套思路,那它们之间到底具有怎样的区别和联系呢?为了说明这个问题,我们先介绍一个引理:

设𝑋, 𝑌为两个向量,则

[𝑐𝑜𝑟𝑟(𝑋, 𝑌)^2 = 𝑅^2

其中𝑅^2 为线性回归𝑌 = 𝑎𝑋 + 𝑏或线性回归X = 𝑎𝑌 + 𝑏的可决系数(其中𝑎,𝑏是待回归系数)。

如果我们在单因子测试(线性回归法)中使用模型
𝑟 = 𝛽𝑋 + 𝑐
(r 是股票收益率,X 是因子暴露度,c 是常数项,c 可以理解为市场因子)并且假设我们在计算因子 IC 值的时候,不预先对因子暴露度进行市值、行业调整了,就使用原始的因子暴露度 X,则本期因子 IC 值为𝑐𝑜𝑟𝑟(𝑋, 𝑟),根据引理,因子 IC 值的平方就等于单因子测试的回归模型的𝑅^2。

所以,因子 IC 值本质上反映的是下期收益率和本期因子暴露度的线性相关程度(𝑅2的平方根),是使用该因子预测收益率的稳健性(IC 值越大,这个因子的收益越稳定,波动越小);而回归法中计算出的因子收益率本质上是一个斜率,反映的是从该因子可能获得的

收益率的大小,这并不能说明任何关于线性拟合优度的信息(也就是说,因子收益率很大时,也可能出现𝑅2很小的情形);至于回归法中计算出的 t 值,在一元线性回归中 t 值与𝑅2反映的信息一致(二者对应关系为,当𝑅2 = 0时 t 值也为 0,当𝑅2 = 1时 t 值为无穷大),但是由于我们所采用的回归模型包括了行业变量,所以 t 值仅代表被测因子对股票收益的解释能力(而不能代表模型的整体拟合优度)。

总结一下,IC 值反映模型整体线性拟合优度,t 值反映被测单因子对模型的解释能力是否显著,因子收益率与前两者差别较大,它反映的是可能获得的收益率的大小,而对这个收益是否稳健未知。

事实上,我们在计算因子 IC 值时也对因子暴露度进行市值、行业预调整了,情况还比上面分析的要复杂一些,但是精髓不变,我们的结论仍然大致正确。

分层模型回测

依照因子值对股票进行打分,构建投资组合回测,是最直观的衡量指标优劣的手段。一般来说,通过回归法和计算因子 IC 值都无法确定因子的单调性(例如,某因子值排名在中间 1/3 的个股表现比前 1/3 和后 1/3 的个股表现要好),但是分层回测法是可以确定因子单调性的。分层回测法逻辑简单,结果清晰,操作方便,并且具有能区分因子单调性的独特优势,是接受度非常高的一种单因子测试手段。

测试模型构建方法如下:

  1. 股票池、回溯区间都与回归法相同。
  2. 换仓期:在每个自然月最后一个交易日核算因子值,在下个自然月首个交易日按当日收盘价换仓。
  3. 数据处理方法:不进行任何加工,因子值为空的股票不参与分层。
  4. 分层方法:在每个一级行业内部对所有个股按因子大小进行排序,每个行业内均分成N 个分层组合。如图表 6 所示,黄色方块代表各行业内个股初始权重,可以相等也可以不等(我们直接取相等权重进行测试),分层具体操作方法为 N 等分行业内个股权重累加值,例如图示行业 1 中,5 只个股初始权重相等(不妨设每只个股权重为 0.2),假设我们欲分成 3 层,则分层组合 1 在权重累加值 1/3 处截断,即分层组合 1 包含个股 1 和个股 2,它们的权重配比为 0.2:(1/3-0.2)=3:2,同样推理,分层组合 2 包含个股 2、3、4,配比为(0.4-1/3):0.2:(2/3-0.6)=1:3:1,分层组合 4 包含个股 4、5,配比为 2:3。以上方法是用来计算各个一级行业内部个股权重配比的,行业间权重配比与基准组合(我们使用沪深 300)相同,也即行业中性。
  5. 评价方法:回测年化收益率、夏普比率、信息比率、最大回撤、胜率等。

image

单因子测试结果分析

分层模型回测分析方法

在华泰单因子测试系列前两篇报告中,我们用图表夹杂文字说明的形式,对各个细分因子的分层回测结果一一进行了详细展示。从第三篇报告《华泰单因子测试之动量类因子》开始,我们对报告展示形式加以改进,在维持前两篇测试报告的细致程度的基础上,为了更高效地展示结果,我们会在此处集中说明所有图表的计算细节和分析方法,后面细分因子的测试结果均会使用相同的模板,便于读者速览和对比。

分层测试详细展示图表包括:

1. 分五层组合回测绩效分析表(20050509~20161230)。其中组合 1~组合 5 为按该因子从小到大排序构造的行业中性的分层组合。基准组合为行业中性的等权组合,具体来说就是将组合 1~组合 5 合并,一级行业内部个股等权配置,行业权重按当期沪深
300 行业权重配置。多空组合是在假设所有个股可以卖空的基础上,每月调仓时买入组合 1,卖空组合 5。回测模型在每个自然月最后一个交易日核算因子值,在下个自然月首个交易日按当日收盘价调仓(分层组合构建法等更多细节参见上一章“分层模型回测”小节)。
2. 分五层组合回测净值图。按前面说明的回测方法计算组合 1~组合 5、基准组合的净值,与沪深 300、中证 500 净值对比作图。
3. 分五层组合回测,用组合 1~组合 5 的净值除以基准组合净值的示意图。可以更清晰地展示各层组合在不同时期的效果。
4. 组合 1 相对沪深 300 月超额收益分布直方图。该直方图以[-0.5%,0.5%]为中心区间,向正负无穷方向保持组距为 1%延伸,在正负两个方向上均延伸到最后一个频数不为零的组为止(即维持组距一致,组数是根据样本情况自适应调整的)。
5. 分五层时的多空组合收益图。再重复一下,多空组合是买入组合 1、卖空组合 5(月度调仓)的一个资产组合。多空组合收益率是由组合 1 的净值除以组合 5 的净值近似核算的。
6. 分十层组合回测时,各层组合在不同年份间的收益率及排名表。每个单元格的内容为在指定年度某层组合的收益率(均为整年收益率),以及某层组合在全部十层组合中的收益率排名。最后一列是分层组合在 2006~2016 的排名的均值。

7. 不同市值区间分层组合回测绩效指标对比图(分十层)。我们将全市场股票按市值排名前 1/3,1/3~2/3,后 1/3 分成三个大类,在这三类股票中分别进行分层测试,基准组合构成方法同前面所述(注意每个大类对应的基准组合并不相同)。

8. 不同行业间分层组合回测绩效分析表(分五层)。我们在不同一级行业内部都做了分层测试,基准组合为各行业内该因子非空值的个股等权组合(注意每个行业对应的基准组合并不相同)。

image

image

image

image

image

image

image

image

image

image

image

image

回归法测试结果分析

上一章中,我们依次展示了十二个换手率因子分层回测的结果,本章我们将使用回归法进 行截面规律统计。回归法是多因子模型领域应用最广的方法,回归法单因子测试的结果不 仅用于初步因子筛选,在后续构建收益预测模型时还会进一步应用。具体模型设置和下面 图表中各指标含义参见第二章“单因子测试流程”的第一小节“回归法”。我们还列出了 前期报告因子回归测试结果(估值、成长、动量类因子)与本期换手率类因子回归结果进 行对比,如下所示。

从上面的图表可以看出,换手率因子的整体效果都还不错。取假设检验 H:因子收益率序列均值显著异于 0。则假设检验 H 对应的 t 值在图表 106 中最后一列,所有十二个换手率因子都能通过该假设检验。如果从回归法得出的|t|均值和因子收益率均值来看,1 个月日均换手率(turn_1m)和 1 个月内换手率序列标准差(std_turn_1m)这两个因子表现最好;如果从“因子收益率序列均值显著异于零”的 t 检验结果来看,1 个月日均换手率乖离率(bias_turn_1m)和 1 个月内换手率序列标准差乖离率(bias_std_turn_1m)因子要强于turn_1m 和 std_turn_1m 因子。其实这一现象背后的原因是—— bias_turn_1m 、bias_std_turn_1m 这两个因子的因子收益率序列波动比较小,也就是说,这两个因子的表现相对更稳定一些。从上面的图表也确实可以看出,bias_turn_1m、bias_std_turn_1m 对应的曲线比较平滑。并且,在前一章分层回测中,也是 bias_turn_1m、bias_std_turn_1m因子的整体表现强于 turn_1m、std_turn_1m 因子。

由于换手率因子的分层测试结果与回归法结果并不完全一致,我们想要更全面地了解这种差异因何而产生。图表 106 中的结果是由WLS 回归产生(用个股流通市值的平方根作为权重,具体描述参见第二章“单因子测试流程”的第一小节“回归法”中测试模型构建方法的第 5 点),我们将 WLS 回归改成 OLS 回归,回归测试结果对比显示在图表 110 中。通过观察可以发现,在 OLS 回归下所有换手率类因子的效果都有所提升,这也和换手率因子的特点有关——在大盘股中效果较差,在中、小盘股中效果很好。并且 OLS 回归下bias_turn_1m、bias_std_turn_1m 因子的效果是好于 turn_1m、std_turn_1m 因子的,可以从某种程度上说明,bias_turn_1m、bias_std_turn_1m 因子在大盘股中失效得更严重。

image

与前三篇单因子测试的报告结果进行对比,我们发现换手率因子的整体效果比估值、成长因子要好,但不如动量因子。这一结论也比较符合投资者的直观印象。估值与成长因子是部分或全部源于财务数据的因子,灵敏度不如量价类因子,在多因子模型中的贡献度也不如量价类因子。而“量”与“价”相比,通常还是价格因素给投资者带来的刺激更大,量、价间存在一定协同效应,由此还可以衍生出许多技术类因子,将在以后的测试报告中详加讨论,欢迎持续关注。

因子 IC 值的计算与分析

在回归法因子测试完成之后,我们还将进行因子 IC 值的计算与分析。请注意,我们此处计算的因子 IC 值并不是因子原始暴露度和下期收益的相关系数,而是“经过市值和行业调整的”因子暴露度和下期收益的相关系数(具体计算方法详见第二章“单因子测试流程”的第二小节“因子 IC 值的计算”),所以因子 IC 值的计算结果和回归测试结果并不是完全一致的(回归模型中包含行业哑变量而不包含市值相关解释变量)。

我们还仿照回归法分析过程,画出各因子 IC 值累积曲线,可以从图中观察换手率因子在各段历史时期的表现。

下面图表中 IR 比率是指因子 IC 值均值与标准差的比值的绝对值,能够衡量因子有效性。因子 IC 值的分析结果与回归法基本一致,turn_1m、std_turn_1m 因子 IC 序列均值绝对值比较大,但是 IC 序列标准差也大;bias_turn_1m、bias_std_turn_1m 因子 IC 序列均值绝对值小一些,但是 IC 序列标准差也小。从 IR 比率来看还是 turn_1m、std_turn_1m 要稍好一些,尤其是 std_turn_1m 因子的 IR 比率达到 0.82,比动量因子中经典的 1 个月反转因子 IR 值还要高。

与前三篇单因子测试的报告结果进行对比,我们发现换手率因子在 IC 值分析方面各项表现也都强于估值和成长因子,比动量因子稍弱一点。

换手率因子或可选用较短样本期

近 1 个月收益率、近 1 个月换手率均为多因子模型中常见的因子,并且经测试验证,它们确实要比近 N 个月收益率、近 N 个月换手率(N>1)因子效果出色。然而,我们还想刨根究底地问一下:为什么不用最近 K 个交易日的量价信息构建因子,而一定要用近 1 个月的呢?究竟怎样的样本期长度能使因子的效果达到最优?俗话说的好,理不辨不明,事不鉴不清。于是,我们就对动量类和换手率类因子进行了样本期长度的敏感性测试,如下列图表所示。

在图表 115~122 中,我们分别针对本报告中详细讨论的四类换手率因子,选择样本期为N 天(N=1,3,5,……,21),进行回归测试、IC 值分析和分层测试。结果发现,1 个月的样 本期长度对于换手率类因子来说并不是最优的。对于日均换手率和日均换手率乖离率来说,用 3~5 天长度的样本期最佳;对于换手率序列标准差来说,也是用 5 天左右长度的样本 期最佳;对于换手率序列标准差乖离率来说,分层法的测试结果显示 11 天左右长度的样 本期最佳,而回归法和 IC 值分析的结果仍然支持 5 天左右最佳,两者不太一致。总而言 之,我们只需要用过去几个交易日的换手率就能对下期收益率做出较好的预测了,更久以 前的换手率并不能提供太多额外有效的信息。

关于换手率因子的测试结果似乎有些出乎意料,那么对于上篇报告中涉及的动量类因子呢? 在图表 123~124 中,我们对过去 N 个交易日的收益率因子和过去 N 个交易日的日换手率 加权日均收益率因子也进行了回归法测试和 IC 值分析(N=1,3,5,……,47)。结果发现,动 量因子用过去 21~33 天的样本期长度较佳,在这段较宽泛的样本期选择区间内,因子表 现变动不敏感。如此倒是证实了,动量因子确实是取 1 个月左右最佳。

综上所述,对于换手率因子,我们或可选用较短的样本期,以便产生更好的效果。

换手率因子效果对比总结

我们将分层测试的结果汇总在下面图表中,其中 TOP 组合是指分五层组合中的组合 1,因子单调性得分是指十层组合在 2006~2016 年的收益排序均值与向量(1,2,…,10)’的秩相关系数。从 TOP 组合信息比率、多空组合年化收益率、多空组合夏普比率、因子单调性等角度来说,都是 bias_turn_1m、bias_std_turn_1m 因子表现出众。同时我们将回归法测试和 IC 值分析的结果也汇总在下面,从因子收益率均值、IC 值均值、IR 比率等角度来说,是 turn_1m、std_turn_1m 因子效果突出,与分层测试的结果略有出入。但我们在上上章“回归法测试结果分析”中也指出了,如果将回归模型由 WLS 回归(用个股流通市值平方根作为权重)改成 OLS 回归,bias_turn_1m、bias_std_turn_1m 因子的表现就会强于 turn_1m、std_turn_1m 因子。这从侧面体现了换手率乖离率类因子在大盘股中失效程度更高。

我们将前三篇单因子测试报告中估值、成长、动量因子的结果也对比展示在下面。可以发现,换手率因子的效果整体比估值、成长因子强一些,但比动量因子稍弱。再次说明一下,估值和成长因子是部分或全部源于财务数据的因子,与量价信息相关性较低,并且逻辑清楚,是一类优质备选因子。动量、换手率以及将要测试的波动率等大类因子虽效果强于财务类因子,但彼此间相关性也比较大。需要注意的是,本期被测的十二个换手率因子间相关性很强,需要有所取舍地使用。另外,我们通过样本期长度敏感性测试发现,换手率因子或可考虑采用更短的样本期,以便取得更佳的效果。

目前我们正在陆续推出单因子测试系列报告,后续规划包括财务质量因子、杠杆因子、规模因子、波动率因子、分析师情绪因子、股东因子、技术因子等大类因子的测试,在单因子测试系列之后我们将深入探讨如何在大类因子中进行因子精选并赋予合适权重从而构造优秀的风格因子,敬请关注。