【研报分享】华泰证券-华泰单因子测试之动量类因子

研报干货
华泰证券
动量类因子
标签: #<Tag:0x00007faffc8f24c0> #<Tag:0x00007faffc8f2380> #<Tag:0x00007faffc8f2240>

#1

本文导读:

待测因子:传统的1个月反转等因子,以及改进的动量因子
动量因子是一类非常重要的风格因子,本报告中我们选取了十三个具有代 表性的动量因子进行测试,包括 HAlpha(个股 60 个月收益与上证综指线 性回归的截矩项), return_Nm(个股最近 N 个月的收益率,N=1、3、6、 12),wgt_return_Nm(个股最近 N 个月的日换手率加权平均日收益率, N=1、3、6、12),exp_wgt_return_Nm(个股最近 N 个月的指数衰减权 重乘以日换手率加权平均日收益率,N=1、3、6、12)。经实证检验,两种 改进方式都对传统的 N 个月反转因子有所加强。

动量因子总体与市值因子略负相关,各因子两两间正相关性较强
动量因子与市值因子的相关性基本上就约等于市值因子在过去一段时间的 因子收益率,所以经典的 1 个月反转与市值因子是略呈负相关性的,而 return_12m 与市值因子的相关性就会比较弱一点。改进的动量因子额外引 入了换手率信息,由于换手率也是一个负向因子,综合作用下相关性仍显 负向。各动量因子两两之间普遍具有比较强的正相关性,与之前测试过的 估值、成长类因子对比,相关性显得更加突出。如果要组合使用各动量因 子构建选股模型,需要注意处理多重共线性问题。

单因子测试框架:分层回测、回归法、因子 IC 值分析
首先,我们对各成长因子依次进行详细的分层模型回测,分析各分层组合 的业绩表现和多空组合的表现,判别因子区分度、单调性、稳定性和在不 同规模公司、不同一级行业间的业绩强弱。接下来我们使用回归法进行因 子测试,对因子收益率序列和回归产生的 t 值序列进行统计层面上的分析。 我们还计算了各因子的 IC 值序列、IR 比率,综合识别有效因子。

测试结果:动量因子绩效出众,exp_wgt_return_6m 等因子尤为突出
从 TOP 组合信息比率、多空组合年化收益率、多空组合夏普比率等角度来 说,都是 exp_wgt_return_6m、exp_wgt_return_3m、wgt_return_1m、 return_1m 四个因子表现出众。同时,将回归法测试和 IC 值分析的结果与 分层回测结果对比,只有几个细节指标略有出入,整体来讲是保持一致的。前期报告中效果最突出的 BP 和 ROE 当季同比增长率因子,在动量因子超 高的因子收益率和 IC 值面前都略显失色。不过,估值和成长因子能够提供 量价数据之外的有效信息,仍算一类优质备选因子。

风险提示: 单因子测试结果是历史经验的总结,存在失效的可能。

动量因子在 A 股市场实证分析

动量因子的选取及测试框架
本文是我们的多因子系列研究第四篇,是单因子测试系列的第三篇,在多因子系列首篇报 告中,我们系统地阐述了多因子模型的基本理论,详细描述了多因子模型构建的流程,从 多因子系列第二篇报告开始,我们对不同的风格因子单独进行详细的研究和检验,通过综 合对比评价,筛选出能持续获得稳健收益的优质因子,这正是构建多因子选股模型的关键 一步。在首篇报告中我们共列出了十二类风格因子:估值因子(Value Factor)、成长因子 (Growth Factor)、财务质量因子(Financial Quality Factor)、杠杆因子(Leverage Factor)、 规模因子(Size Factor)、动量因子(Momentum Factor)、波动率因子(Volatility Factor)、 换手率因子(Turnover Factor)、改进的动量因子(Modified Momentum Factor)、分析师 情绪因子(Sentiment Factor)、股东因子(Shareholder Factor)和技术因子(Technical Factor), 在前两篇单因子测试报告中,我们对估值、成长类因子进行了详细的测试分析, 在本文中,我们将主要针对动量类及改进的动量类因子进行分析,找出其在二级市场不同 行业、不同规模上市公司中的分布规律,并通过分层回测、回归法、计算因子 IC 值等测 试因子有效性。

动量类因子主要是指过去一段时间内资产的收益率,是一类非常重要的风格因子。本报告 中将测试的因子详细列表如下:

如果某只股票在过去一段时间的涨跌幅明显高于或低于同类型股票的平均水平,从概率上 来讲,它的股价在未来可能会有所回归。所以,我们第一步将先观察成长因子在 A 股市场 的分布规律,通过分析动量因子在不同行业及不同规模上市公司间的差异,判断在单因子 回归测试中是否应该处理行业、规模因素的影响。第二步我们将建立分层模型进行回测, 详细观察因子区分度、单调性等规律。第三步我们将使用回归法进行单因子测试,结合因 子 IC 值分析,选出有效且稳健的因子。第四步,根据以上分析结果进行对比总结,探讨 各因子的特点和优劣。

动量因子的行业间差异
动量因子在不同行业间存在显著差异,并且随时间变化,同一行业的动量因子的绝对大小 和与其他行业对比的相对大小也在不断变化中。因为动量因子实际上就是个股过去一段时 间的收益水平,所以上一句话反应的就是行业轮动现象,比如 2005.06~2008.10 是周期 板块主导的行情,2008.11~2012.07 是消费板块主导的行情,2012.08 至去年是 TMT 板 块主导的行情,在相关行业处于强势状态时动量因子的值就会比较大一些,随时间变化强 势的行业也是处于不断变化中的。因此,动量因子的行业间差异逻辑比较清楚明了,这里 就不展开讨论了(关于股票市场周期性行为、行业轮动现象的详细论述请参考华泰金工经 济周期系列研究报告)。

动量因子与市值因子的相关性
除去行业对因子存在较大影响外,上市公司的规模也是对各大类因子产生作用的潜在因素。 我们在前两篇单因子测试报告中对估值、成长类因子进行了详细分析,发现市值因子与大 部分估值类因子具有一定相关性,但是与成长类因子间相关性不大。这里面的逻辑也是比 较明晰的,因为估值因子的计算公式里包含了总市值因素,但成长因子完全由财报信息计 算而得,与市值因子相关性较低。对于本报告中涉及的动量类因子,其与市值因子间相关 性主要源于——在牛市中小盘股一般比大盘股涨得更快,但在股灾时小盘股也跌得更快。 实际上,若换一个角度去理解,动量因子与市值因子的相关性基本上就约等于市值因子在 过去一段时间的因子收益率。鉴于 2007 年之后市场风格一直偏向小盘股,所以经典的 1 个月反转是与市值因子是具有某种程度的负相关性的,相比较而言,过去 12 个月收益率 与市值因子的相关性就会比较弱一点。而对于改进的动量因子,由于额外引入的换手率因 子也是一个负向因子,所以综合作用下 wgt_return_1m、exp_wgt_return_1m 等因子与市 值因子应该也是负相关的。关于市值因子的效用我们还会有专题报告展开讨论,这里就不 详述了。

动量因子间相关性分析
在本章前两个小节中,我们分析了成长因子在不同行业的分布差异性及成长因子与市值因 子的相关性,接下来,我们将计算各成长因子之间的相关性。假设因子 A 和 B 之间的月度 相关系数序列为{𝐶𝑜𝑟𝑟𝑖𝐴𝐵},其中𝐶𝑜𝑟𝑟𝑖𝐴𝐵是在第i个月月末这一截面上因子 A、B 在所有个股 上的因子暴露度的相关系数,我们构造了一个相关强度指标:
image

该指标结合了因子平均相关系数和相关系数的稳定性,能够综合反映因子之间的相关情况。 我们分别计算各因子两两之间在过去 36 个月(2013 年 12 月到 2016 年 11 月)内的相关 强度指标,如图表 3 所示。计算过程中涉及的相关系数均值和方差详细展示在图表 4 和 5 中。通过观察可以发现,各动量因子两两之间普遍具有比较强的正相关性,与之前测试过 的估值、成长类因子对比,相关性显得更加突出。如果要组合使用各动量因子构建选股模 型,需要注意处理多重共线性问题。

图表 4 和图表 5 分别反映因子两两之间相关系数的平均大小和相关系数稳定性,能在图表 3 数据之外提供一些补充信息。

图表 3 对于构建风格因子具有一定参考意义,因子合成时要根据相关性关系赋予各因子合 理权重,在后续报告中我们将详细阐述。


单因子测试流程
在多因子系列首篇报告《华泰多因子模型体系初探》(2016.09)中,我们系统地介绍了有 效因子识别(即单因子测试)的理论基础和研究思路,在多因子系列第二篇报告《华泰单 因子测试之估值类因子》中我们着眼于实践过程,给出了详细的流程操作说明。为避免阅 读障碍,我们此处将单因子详细测试流程再复述一遍。

回归法
回归法是一种最常用的测试因子有效性的方法,具体做法是将因子在第T期的暴露度与T+ 1期的股票收益进行线性回归,所得到的回归系数即为因子在T期的因子收益率,同时还能 得到该因子收益率在本期回归中的显著度水平——t 值。我们的回归模型为
image

在所有截面期上,我们对因子d进行回归测试,能够得到该因子的因子收益率序列(即所 有截面期回归系数𝑋𝑑 𝑇构成的序列)和对应的 t 值序列。t 值指的是对单个回归系数𝑋𝑑 𝑇的 t 检验统计量,描述的是单个变量显著性,t 值的绝对值大于临界值说明该变量是显著的, 即该解释变量(T期个股在因子 d的暴露度)是真正影响因变量(T+1期个股收益率)的 一个因素。也就是说,在每个截面期上,对于每个因子的回归方程,我们设
image

测试模型构建方法如下:
1. 股票池:全 A 股,剔除 ST、PT 股票,剔除每个截面期下一交易日停牌的股票。
2. 回溯区间:2005-04-29 至 2016-11-30。
3. 截面期:每个自然月的最后一个交易日计算因子暴露度,与下一整个自然月的个股超 额收益(以沪深 300 指数为基准)进行回归。 4. 数据处理方法: a) 因子暴露度的计算方法已在图表 1 中进行说明,个股收益率均用 Wind 后复权收 盘价核算,换手率因子也取自 Wind,因子如有缺失值暂时不处理; b) 中位数去极值:设第 T 期某因子在所有个股上的暴露度序列为𝐷𝑖,𝐷𝑀为该序列中 位数,𝐷𝑀1为序列|𝐷𝑖 −𝐷𝑀|的中位数,则将序列𝐷𝑖中所有大于𝐷𝑀 +5𝐷𝑀1的数重设 为𝐷𝑀 +5𝐷𝑀1,将序列𝐷𝑖中所有小于𝐷𝑀 −5𝐷𝑀1的数重设为𝐷𝑀 −5𝐷𝑀1; c) 标准化:将去极值处理后的因子暴露度序列减去其现在的均值、除以其标准差, 得到一个新的近似服从N(0,1)分布的序列,这样做可以让不同因子的暴露度之间 具有可比性; d) 缺失值处理:得到新的因子暴露度序列后,将因子暴露度缺失的地方设为 0(这 里解释一下,由于不同因子可能在不同个股处存在缺失值,若不对缺失值进行处 理则每个单因子回归的票池并不完全相同,不同单因子回归结果的可比性较差, 但如果将所有出现缺失值的个股都从回归票池中剔除,当数据源质量不佳时可能会造成票池大幅减少,回归结果同样不可信,所以这里折中处理,将因子暴露度 缺失的地方设为新序列的均值,即设为零,可视作当存在缺失值时我们认为此个 股的因子值与全市场平均情况相同,即持中性看法)。
5. 回归权重:由于普通最小二乘回归(OLS)可能会夸大小盘股的影响(因为小盘股的 估值等因子出现极端值概率较大,且小盘股数目很多,但占全市场的交易量比重较小), 并且回归可能存在异方差性,故我们参考 Barra 手册,采用加权最小二乘回归(WLS), 使用个股流通市值的平方根作为权重,此举也有利于消除异方差性。
6. 因子评价方法:
a) t 值序列绝对值平均值——因子显著性的重要判据;
b) t 值序列绝对值大于 2 的占比——判断因子的显著性是否稳定; c) 因子收益率序列平均值,以及该均值零假设检验的 t 值——判断因子收益率序列 是否方向一致,并且显著不为零;
d) t 值序列均值的绝对值除以 t 值序列的标准差——结合显著性和波动性,辅助判断 因子是否有效、稳健。

因子 IC 值的计算
因子的 IC 值是指因子在第 T 期的暴露度与 T+1 期的股票收益的相关系数,即

测试模型构建方法如下:

  1. 股票池、回溯区间、截面期均与回归法相同。
  2. 因子值在去极值、标准化、去空值处理后,在截面期上用其做因变量对市值因子及行 业因子(哑变量)做线性回归,取残差作为因子值的一个替代。这样做可以消除行业 因素和市值因素对因子的影响。计算残差序列和 T+1 期股票收益序列的相关系数作为 T 期因子 IC 值。
  3. 因子评价方法:
    a) IC 值序列的均值大小——因子显著性;
    b) IC 值序列的标准差——因子稳定性;
    c) IR 比率(IC 值序列均值与标准差的比值)——因子有效性;
    d) IC 值累积曲线——随时间变化效果是否稳定;
    e) IC 值序列大于零的占比——因子作用方向是否稳定。

因子收益率、t 值与 IC 值之间的关系
前两小节分别介绍了用回归法、IC 值评价因子有效性的两套思路,那它们之间到底具有怎 样的区别和联系呢?为了说明这个问题,我们先介绍一个引理: 设𝑋,𝑌为两个向量,则


如果我们在单因子测试(线性回归法)中使用模型 𝑟 = 𝛽𝑋 +𝑐 (r 是股票收益率,X 是因子暴露度,c 是常数项,c 可以理解为市场因子)并且假设我们 在计算因子 IC 值的时候,不预先对因子暴露度进行市值、行业调整了,就使用原始的因 子暴露度 X,则本期因子 IC 值为𝑐𝑜𝑟𝑟(𝑋,𝑟),根据引理,因子 IC 值的平方就等于单因子测 试的回归模型的𝑅^2。

所以,因子 IC 值本质上反映的是下期收益率和本期因子暴露度的线性相关程度(𝑅^2的平方根),是使用该因子预测收益率的稳健性(IC 值越大,这个因子的收益越稳定,波动越小);而回归法中计算出的因子收益率本质上是一个斜率,反映的是从该因子可能获得的收益率的大小,这并不能说明任何关于线性拟合优度的信息(也就是说,因子收益率很大 时,也可能出现𝑅^2很小的情形);至于回归法中计算出的 t 值,在一元线性回归中 t 值与𝑅^2 反映的信息一致(二者对应关系为,当𝑅^2 = 0时 t 值也为 0,当𝑅^2 = 1时 t 值为无穷大), 但是由于我们所采用的回归模型包括了行业变量,所以 t 值仅代表被测因子对股票收益的 解释能力(而不能代表模型的整体拟合优度) 。

总结一下,IC 值反映模型整体线性拟合优度,t 值反映被测单因子对模型的解释能力是否 显著,因子收益率与前两者差别较大,它反映的是可能获得的收益率的大小,而对这个收 益是否稳健未知。

事实上,我们在计算因子 IC 值时也对因子暴露度进行市值、行业预调整了,情况还比上 面分析的要复杂一些,但是精髓不变,我们的结论仍然大致正确。

分层模型回测
依照因子值对股票进行打分,构建投资组合回测,是最直观的衡量指标优劣的手段。一般 来说,通过回归法和计算因子 IC 值都无法确定因子的单调性(例如,某因子值排名在中 间 1/3 的个股表现比前 1/3 和后 1/3 的个股表现要好),但是分层回测法是可以确定因子单 调性的。分层回测法逻辑简单,结果清晰,操作方便,并且具有能区分因子单调性的独特 优势,是接受度非常高的一种单因子测试手段。

测试模型构建方法如下: 1. 股票池、回溯区间都与回归法相同。 2. 换仓期:在每个自然月最后一个交易日核算因子值,在下个自然月首个交易日按当日 收盘价换仓。 3. 数据处理方法:不进行任何加工,因子值为空的股票不参与分层。 4. 分层方法:在每个一级行业内部对所有个股按因子大小进行排序,每个行业内均分成 N 个分层组合。如图表 6 所示,黄色方块代表各行业内个股初始权重,可以相等也可 以不等(我们直接取相等权重进行测试),分层具体操作方法为 N 等分行业内个股权 重累加值,例如图示行业 1 中, 5 只个股初始权重相等(不妨设每只个股权重为 0.2), 假设我们欲分成 3 层,则分层组合 1 在权重累加值 1/3 处截断,即分层组合 1 包含个 股 1 和个股 2,它们的权重配比为 0.2:(1/3-0.2)=3:2,同样推理,分层组合 2 包含个 股 2、3、4,配比为(0.4-1/3):0.2:(2/3-0.6)=1:3:1,分层组合 4 包含个股 4、5,配比 为 2:3。以上方法是用来计算各个一级行业内部个股权重配比的,行业间权重配比与 基准组合(我们使用沪深 300)相同,也即行业中性。 5. 评价方法:回测年化收益率、夏普比率、信息比率、最大回撤、胜率等。

单因子测试结果分析

分层模型回测分析方法

在华泰单因子测试系列前两篇报告中,我们用图表夹杂文字说明的形式,对各个细分因子 的分层回测结果一一进行了详细展示。在本报告中,我们将依然维持前两篇测试报告的细 致和完整程度,但为了更高效地展示结果,我们会在此处集中说明所有图表的计算细节和 分析方法,后面细分因子的测试结果均会使用相同的模板,便于读者速览和对比。

分层测试详细展示图表包括:
1. 分五层组合回测绩效分析表(20050509~20161130)。其中组合 1~组合 5 为按该因 子从小到大排序构造的行业中性的分层组合。基准组合为行业中性的等权组合,具体 来说就是将组合 1~组合 5 合并,一级行业内部个股等权配置,行业权重按当期沪深 300 行业权重配置。多空组合是在假设所有个股可以卖空的基础上,每月调仓时买入 组合 1,卖空组合 5。回测模型在每个自然月最后一个交易日核算因子值,在下个自 然月首个交易日按当日收盘价调仓(分层组合构建法等更多细节参见上一章“分层模 型回测”小节)。
2. 分五层组合回测净值图。按前面说明的回测方法计算组合 1~组合 5、基准组合的净 值,与沪深 300、中证 500 净值对比作图。
3. 分五层组合回测,用组合 1~组合 5 的净值除以基准组合净值的示意图。可以更清晰 地展示各层组合在不同时期的效果。
4. 组合 1 相对沪深 300 月超额收益分布直方图。该直方图以[-0.5%,0.5%]为中心区间, 向正负无穷方向保持组距为 1%延伸,在正负两个方向上均延伸到最后一个频数不为 零的组为止(即维持组距一致,组数是根据样本情况自适应调整的)。
5. 分五层时的多空组合收益图。再重复一下,多空组合是买入组合 1、卖空组合 5(月 度调仓)的一个资产组合。多空组合收益率是由组合 1 的净值除以组合 5 的净值近似 核算的。
6. 分十层组合回测时,各层组合在不同年份间的收益率及排名表。每个单元格的内容为 在指定年度某层组合的收益率,以及某层组合在全部十层组合中的收益率排名。最后 一列是分层组合在 2006~2016 的排名的均值。2016 年的收益率核算是截至 11 月 30 日的,其余年份则为整年的收益率。
7. 不同市值区间分层组合回测绩效指标对比图(分十层)。 我们将全市场股票按市值排名 前 1/3,1/3~2/3,后 1/3 分成三个大类,在这三类股票中分别进行分层测试,基准组 合构成方法同前面所述(注意每个大类对应的基准组合并不相同)。
8. 不同行业间分层组合回测绩效分析表(分五层)。我们在不同一级行业内部都做了分层 测试,基准组合为各行业内该因子非空值的个股等权组合(注意每个行业对应的基准 组合并不相同)



image

















































回归法测试结果分析
上一章中,我们依次展示了十三个动量因子分层回测的结果,本章我们将使用回归法进行 截面规律统计。回归法是多因子模型领域应用最广的方法,回归法单因子测试的结果不仅 用于初步因子筛选,在后续构建收益预测模型时还会进一步应用。具体模型设置和下面图 表中各指标含义参见第二章“单因子测试流程”的第一小节“回归法”。

我们还列出了前期报告因子回归测试结果(估值及成长类因子)与本期动量类因子回归结 果进行对比,如下所示。


从上面的图表可以看出,所有动量因子的效果都很优秀。取假设检验 H:月均因子收益率 显著异于 0。则假设检验 H 对应的 t 值在图表 111 中最后一列,除 HAlpha 因子之外的其 他十二个动量因子能通过该假设检验。将这些因子互相比较可以发现,综合表现最好的两 个因子是指数衰减日换手率加权平均 3 个月、6 个月动量因子(即 exp_wgt_return_3m、 exp_wgt_return_6m),之后为日换手率加权平均 1 个月、3 个月动量因子(即 wgt_return_1m、wgt_return_3m),它们都要略强于经典的1个月动量因子(即return_1m) 。 不过改进的动量因子在价格信息之外引入了流动性信息,与另一个大类因子——流动性因 子的共线性可能会被加强。我们将在后续报告中深入讨论,欢迎持续关注。

与前两篇单因子测试的报告结果进行对比,我们发现动量因子的整体效果比估值、成长因 子要好很多。估值与成长因子是部分或全部源于财务数据的因子,灵敏度不如量价类因子。 虽然股票的长期业绩从逻辑上来讲是基于财务数据表现的,但股票市场的价格瞬息万变, 时刻充满掘金机会,对于月度调仓的多因子模型,量价类因子的贡献还是比财务类因子要 大一些的。

因子 IC 值的计算与分析
在回归法因子测试完成之后,我们还将进行因子 IC 值的计算与分析。请注意,我们此处 计算的因子 IC 值并不是因子原始暴露度和下期收益的相关系数,而是“经过市值和行业 调整的”因子暴露度和下期收益的相关系数(具体计算方法详见第二章“单因子测试流程” 的第二小节“因子 IC 值的计算”),所以因子 IC 值的计算结果和回归测试结果并不是完全 一致的(回归模型中包含行业哑变量而不包含市值相关解释变量)。

我们还仿照回归法分析过程,画出各因子 IC 值累积曲线,可以从图中观察成长因子在各 段历史时期的表现。

下面图表中 IR 比率是指因子 IC 值均值与标准差的比值的绝对值,能够衡量因子有效性。 因子 IC 值的分析结果与回归法基本一致,IR 比率最高的三个因子为 exp_wgt_return_3m、 exp_wgt_return_6m、wgt_return_1m,只有 HAlpha、return_12m 两个因子的 IR 比率不 足 0.3。

与前两篇单因子测试的报告结果进行对比,我们发现动量因子在 IC 值分析方面各项表现 也都强于估值和成长因子。


动量因子效果对比总结
我们将分层测试的结果汇总在下面图表中,其中 TOP 组合是指分五层组合中的组合 1, 因子单调性得分是指十层组合在 2006~2016 年的收益排序均值与向量(1,2,…,10) ’的秩 相关系数。从 TOP 组合信息比率、多空组合年化收益率、多空组合夏普比率等角度来说, 都是 exp_wgt_return_6m、exp_wgt_return_3m、wgt_return_1m、return_1m 四个因子 表现出众。同时我们将回归法测试和 IC 值分析的结果也汇总在下面,对比观察可以发现, 在统计意义下基本上也是上述四个因子效果最突出,一些细节指标略有出入,但整体来讲 与分层测试的结果是一致的。
我们将前两篇单因子测试报告中估值、成长因子的结果也对比展示在下面。可以发现,估 值因子中最突出的 BP 和成长因子中最突出的 Profit_G_q、ROE_G_q 与动量因子整体效 果相比,都有不小的差距。不过,估值和成长因子是部分或全部源于财务数据的因子,与 量价信息相关性较低,动量、流动性、波动率等大类因子虽效果强于财务类因子,但彼此 间相关性也比较大。估值、成长因子逻辑清楚,能够提供量价数据之外的有效信息,也算 是一类优质备选因子。

动量类因子在多因子模型中贡献很大,改进方向也很多,我们在本报告中只是进行初步尝 试,后续还有更多深度挖掘计划。



目前我们正在陆续推出单因子测试系列报告,后续规划包括财务质量因子、杠杆因子、规 模因子、波动率因子、换手率因子、分析师情绪因子、股东因子、技术因子等大类因子的 测试,在单因子测试系列之后我们将深入探讨如何在大类因子中进行因子精选并赋予合适 权重从而构造优秀的风格因子,敬请关注。