【研报分享】华泰证券-华泰单因子测试之波动率类因子


#1

本文导读:

待测因子:日收益率标准差、特质波动率、日内最大涨/跌幅波动率等

波动率因子是一类非常重要的风格因子,本报告中我们选取了八个具有代 表性的波动率因子进行测试,包括 std_4m(近 4 个月内日收益率序列的标 准差),id1_std_3m(特质波动率 1:近 3 个月内 CAPM 回归残差的标准 差),id2_std_3m(特质波动率 2:近 3 个月内 Fama-French 三因子回归 残差的标准差),id2_std_up_3m、id2_std_down_3m、id2_std_upd_3m (三因子回归残差上行、下行波动率及两者的和),high_r_std_4m(近 4 个月日内最大涨幅波动率),hml_r_std_5m(近 5 个月日内最大涨幅波动 率减去日内最大跌幅波动率)。经实证检验,这几种波动率因子各具特点。

除 hml_r_std_5m 外其余波动率因子两两间正相关性很强

一般来说,市值较大的公司倾向于波动率较低,经实证检验,波动率类因 子中除 hml_r_std_5m 外均与市值因子呈现明显的负相关性。并且,除 hml_r_std_5m 外,各波动率因子两两之间普遍具有很强的正相关性,与之 前测试过的估值、成长、动量反转、换手率类因子对比,相关性显得更加 突出。如果要组合使用各波动率因子构建选股模型,需要小心处理多重共 线性问题。

单因子测试框架:分层回测、回归法、因子 IC 值分析

首先,我们对各波动率因子依次进行详细的分层模型回测,分析各分层组 合的业绩表现和多空组合的表现,判别因子区分度、单调性、稳定性和在 不同规模公司、不同一级行业间的业绩强弱。接下来我们使用回归法进行 因子测试,对因子收益率序列和回归产生的 t 值序列进行统计层面上的分 析。我们还计算了各因子的 IC 值序列、IR 比率,综合识别有效因子。我 们在分层测试中以单边换手率 0.3%计算交易成本,更为真实地反应因子选 股效果。

测试结果:波动率因子具有一定选股效果,各种波动率因子效果相差不大

在考虑交易成本的条件下,波动率因子样本期一般取 3~5 个月较佳,列举 出的八个因子 TOP 组合年化收益率均在 28%左右,整体效果相差不大, 超过大部分估值、成长、换手率类因子(BP 除外),略逊于动量反转因子。 扣除交易成本后 BP 因子选股效果更为突出(因其换手不频繁、交易成本 低),而换手率因子选股效果则变得一般,TOP 组合超额收益较低。若从 IR 比率的角度看,已测过几类因子有效性排序大致为:动量反转>换手率、 波动率>估值、成长。不过由于 A 股市场不具有良好的做空机制,所以还 需正确看待各类因子 IR 表现,建议更多关注因子在多头方向的选股能力。

风险提示:单因子测试结果是历史经验的总结,存在失效的可能。

波动率因子在 A 股市场实证分析

波动率因子的选取及测试框架

本文是我们的多因子系列研究第六篇,是单因子测试系列的第五篇,在多因子系列首篇报 告中,我们系统地阐述了多因子模型的基本理论,详细描述了多因子模型构建的流程,从 多因子系列第二篇报告开始,我们对不同的风格因子单独进行详细的研究和检验,通过综 合对比评价,筛选出能持续获得稳健收益的优质因子,这正是构建多因子选股模型的关键 一步。在首篇报告中我们共列出了十二类风格因子:估值因子(Value Factor)、成长因子 (Growth Factor)、财务质量因子(Financial Quality Factor)、杠杆因子(Leverage Factor)、 规模因子(Size Factor)、动量因子(Momentum Factor)、波动率因子(Volatility Factor)、 换手率因子(Turnover Factor)、改进的动量因子(Modified Momentum Factor)、分析师 情绪因子(Sentiment Factor)、股东因子(Shareholder Factor)和技术因子(Technical Factor), 在前四篇单因子测试报告中,我们对估值因子、成长因子、动量因子(以及改进 的动量因子)、换手率因子进行了详细的测试分析,在本文中,我们将主要针对波动率类 因子进行分析,找出其在二级市场不同行业、不同规模上市公司中的分布规律,并通过分 层回测、回归法、计算因子 IC 值等测试因子有效性。

波动率类因子主要反映的是过去一段时间内资产价格的波动性大小,是关于资产的价格序 列的二阶矩信息(动量类因子相当于一阶矩信息),是一类非常重要的风格因子。本报告 中将测试的因子详细列表如下:

image

如果某只股票在过去一段时间的波动率明显高于同类型股票的平均水平,则该股票可能是 近期资金多空角逐比较激烈的战场,一般来说,个股波动率高从统计意义上讲是负向指标。 在本报告中,我们第一步将先观察波动率因子在 A 股市场的分布规律,通过分析波动率因 子在不同行业及不同规模上市公司间的差异,判断在单因子回归测试中是否应该处理行业、 规模因素的影响。第二步我们将建立分层模型进行回测,详细观察因子区分度、单调性等 规律。第三步我们将使用回归法进行单因子测试,结合因子 IC 值分析,选出有效且稳健 的因子。第四步,根据以上分析结果进行对比总结,探讨各因子的特点和优劣。

image

波动率因子的行业间差异

波动率因子在不同行业间存在一定差异。我们选取 std_4m、id2_std_3m、hml_r_std_5m 作为波动率因子的代表(因子具体定义见图表 1),计算它们在 2017/2/28 收盘时各一级行 业的中位数分布规律,如下图所示。可以发现,近期建材、石油石化、机械等行业具有较 高的波动率,银行、非银行金融、电力及公用事业等行业波动率较低,并且由于三种波动 率的计算方式各不相同,其在不同行业间的水平存在一定差异。我们认为对上市公司直接 进行跨行业比较意义不大,在单因子测试中还是应考虑行业中性处理。

image

上图说明了,在同一时间点,不同行业间波动率因子的水平存在一定差异。事实上,随时 间变化,同一行业的波动率因子的绝对大小和与其他行业对比的相对大小也在不断变化中。 以 std_4m 为例,在 2006 年至 2016 年间,每年末各一级行业 std_4m 因子值中位数在所 有 29 个一级行业中的排位变化如下表所示。可以看出,同估值、成长等因子类似,波动 率因子在 A 股市场也存在比较明显的行业轮动现象,比如非银行金融行业在不同年份间波 动率排名变化很大,计算机行业从 2009 年开始波动率一直较高;同时,也存在一些行业 的波动率排名一直比较稳定,如银行行业一直波动率较低。行业波动率年份间的波动,一 般是当时政治、金融环境等多重因素影响的结果。

波动率因子与市值因子的相关性

除去行业对因子存在较大影响外,上市公司的规模也是对各大类因子产生作用的潜在因素。 我们在前四篇单因子测试报告中对估值、成长、动量反转、换手率类因子进行了详细分析, 发现市值因子与大部分估值、动量反转、换手率类因子具有一定相关性,但是与成长类因 子间相关性不大。这里面的逻辑也是比较明晰的,因为估值因子的计算公式里包含了总市 值因素,动量反转因子与市值因子的相关性反映的就是市值因子本身的 IC 值(2007 年之 后一直是小盘股占上风),换手率因子与市值因子是比较确定的负向关系(市值越大的股 票换手率倾向于越低),而成长因子完全由财报信息计算而得,与市值因子相关性较低。 对于本报告中涉及的波动率类因子,由于大盘股一般波动率较小,所以猜测是负向关系。 下面我们将进行详细计算。

image

我们针对图表 1 中列出的八个因子,详细计算了它们从 2006 年到 2016 年(在每年最后 一个交易日核算)与市值因子之间的相关系数,见上表。经观察发现,波动率类因子确实 大部分与市值因子间呈负相关关系,只有 hml_r_std_5m 因子例外。

波动率因子间相关性分析

在本章前两个小节中,我们分析了波动率因子在不同行业的分布差异性及波动率因子与市 值因子的相关性,接下来,我们将计算各波动率因子之间的相关性。假设因子 A 和 B 之间 的月度相关系数序列为{𝐶𝑜𝑟𝑟𝑖𝐴𝐵},其中𝐶𝑜𝑟𝑟𝑖𝐴𝐵是在第i个月月末这一截面上因子 A、B 在所 有个股上的因子暴露度的相关系数,我们构造了一个相关强度指标:
image

该指标结合了因子平均相关系数和相关系数的稳定性,能够综合反映因子之间的相关情况。 我们分别计算各因子两两之间在过去 36 个月(2014 年 3 月到 2017 年 2 月)内的相关强 度指标, 如图表6所示。计算过程中涉及的相关系数均值和方差详细展示在图表7和8中。 通过观察可以发现,各波动率因子两两之间普遍具有非常强的正相关性,除 hml_r_std_5m 之外,其余因子提供的信息量几乎无太大差别。如果要组合使用各波动率因子构建选股模 型,需要注意处理多重共线性问题。

图表 7 和图表 8 分别反映因子两两之间相关系数的平均大小和相关系数稳定性,能在图表 6 数据之外提供一些补充信息。

图表 6 对于构建风格因子具有一定参考意义,因子合成时要根据相关性关系赋予各因子合 理权重,在后续报告中我们将详细阐述。

需要注意的是,我们这里计算的是因子值之间的相关系数。在本报告结尾处最后一个图表 里,我们给出了因子 IC 值序列之间的相关系数矩阵以供参考。

单因子测试流程

在多因子系列首篇报告《华泰多因子模型体系初探》(2016.09)中,我们系统地介绍了有 效因子识别(即单因子测试)的理论基础和研究思路,在多因子系列第二篇报告《华泰单 因子测试之估值类因子》中我们着眼于实践过程,给出了详细的流程操作说明。为避免阅 读障碍,我们此处将单因子详细测试流程再复述一遍。

回归法

回归法是一种最常用的测试因子有效性的方法,具体做法是将因子在第T期的暴露度与T+ 1期的股票收益进行线性回归,所得到的回归系数即为因子在T期的因子收益率,同时还能 得到该因子收益率在本期回归中的显著度水平——t 值。我们的回归模型为

image

在所有截面期上,我们对因子d进行回归测试,能够得到该因子的因子收益率序列(即所 有截面期回归系数𝑋𝑑 𝑇构成的序列)和对应的 t 值序列。t 值指的是对单个回归系数𝑋𝑑 𝑇的 t 检验统计量,描述的是单个变量显著性,t 值的绝对值大于临界值说明该变量是显著的, 即该解释变量(T期个股在因子 d的暴露度)是真正影响因变量(T+1期个股收益率)的 一个因素。也就是说,在每个截面期上,对于每个因子的回归方程,我们设

image

其中𝑆𝐸(𝑋𝑑 𝑇)代表回归系数𝑋𝑑 𝑇的标准差的无偏估计量。一般 t 值绝对值大于 2 我们就认为本 期回归系数𝑋𝑑 𝑇是显著异于零的(也就是说,本期因子 d 对下期收益率具有显著的解释作用)。 注意,我们在回归模型中加入了行业因素,能在一定程度上规避行业因素对成长因子的影 响。并且回归法单因子测试中并未对市值因素的影响进行调整,但是在后续计算因子 IC 值的部分会做一些调整。

测试模型构建方法如下:
1. 股票池:全 A 股,剔除 ST、PT 股票,剔除每个截面期下一交易日停牌的股票。 2. 回溯区间:2005-04-29 至 2016-12-30。 3. 截面期:每个自然月的最后一个交易日计算因子暴露度,与下一整个自然月的个股超 额收益(以沪深 300 指数为基准)进行回归。 4. 数据处理方法:
a) 因子暴露度的计算方法已在图表 1 中进行说明,个股收益率均用 Wind 后复权收 盘价进行计算,个股非交易状态的日期里收益率置为空值;
b) 中位数去极值:设第 T 期某因子在所有个股上的暴露度序列为𝐷𝑖,𝐷𝑀为该序列中 位数,𝐷𝑀1为序列|𝐷𝑖 −𝐷𝑀|的中位数,则将序列𝐷𝑖中所有大于𝐷𝑀 +5𝐷𝑀1的数重设 为𝐷𝑀 +5𝐷𝑀1,将序列𝐷𝑖中所有小于𝐷𝑀 −5𝐷𝑀1的数重设为𝐷𝑀 −5𝐷𝑀1;
c) 标准化:将去极值处理后的因子暴露度序列减去其现在的均值、除以其标准差, 得到一个新的近似服从N(0,1)分布的序列,这样做可以让不同因子的暴露度之间 具有可比性;
d) 缺失值处理:得到新的因子暴露度序列后,将因子暴露度缺失的地方设为 0(这 里解释一下,由于不同因子可能在不同个股处存在缺失值,若不对缺失值进行处 理则每个单因子回归的票池并不完全相同,不同单因子回归结果的可比性较差, 但如果将所有出现缺失值的个股都从回归票池中剔除,当数据源质量不佳时可能会造成票池大幅减少,回归结果同样不可信,所以这里折中处理,将因子暴露度 缺失的地方设为新序列的均值,即设为零,可视作当存在缺失值时我们认为此个 股的因子值与全市场平均情况相同,即持中性看法)。
5. 回归权重:由于普通最小二乘回归(OLS)可能会夸大小盘股的影响(因为小盘股的 估值等因子出现极端值概率较大,且小盘股数目很多,但占全市场的交易量比重较小), 并且回归可能存在异方差性,故我们参考 Barra 手册,采用加权最小二乘回归(WLS), 使用个股流通市值的平方根作为权重,此举也有利于消除异方差性。
6. 因子评价方法:
a) t 值序列绝对值平均值——因子显著性的重要判据;
b) t 值序列绝对值大于 2 的占比——判断因子的显著性是否稳定; c) 因子收益率序列平均值,以及该均值零假设检验的 t 值——判断因子收益率序列 是否方向一致,并且显著不为零;
d) t 值序列均值的绝对值除以 t 值序列的标准差——结合显著性和波动性,辅助判断 因子是否有效、稳健。

因子 IC 值的计算
因子的 IC 值是指因子在第 T 期的暴露度与 T+1 期的股票收益的相关系数,即
image
其中,𝐼𝐶𝑑 𝑇代表因子 d 在第 T 期的 IC 值,image 代表所有个股第 T+1 期的收益率向量,image 代 表所有个股第 T 期在因子 d 上的暴露度向量。

测试模型构建方法如下:

  1. 股票池、回溯区间、截面期均与回归法相同。
  2. 因子值在去极值、标准化、去空值处理后,在截面期上用其做因变量对市值因子及行 业因子(哑变量)做线性回归,取残差作为因子值的一个替代。这样做可以消除行业 因素和市值因素对因子的影响。计算残差序列和 T+1 期股票收益序列的相关系数作为 T 期因子 IC 值。
  3. 因子评价方法:
    a) IC 值序列的均值大小——因子显著性;
    b) IC 值序列的标准差——因子稳定性;
    c) IR 比率(IC 值序列均值与标准差的比值)——因子有效性;
    d) IC 值累积曲线——随时间变化效果是否稳定; e) IC 值序列大于零的占比——因子作用方向是否稳定。

因子收益率、t 值与 IC 值之间的关系
前两小节分别介绍了用回归法、IC 值评价因子有效性的两套思路,那它们之间到底具有怎 样的区别和联系呢?为了说明这个问题,我们先介绍一个引理: 设𝑋,𝑌为两个向量,则
image

其中𝑅^2为线性回归𝑌 = 𝑎𝑋 +𝑏或线性回归X = 𝑎𝑌 +𝑏的可决系数(其中𝑎,𝑏是待回归系 数)。

如果我们在单因子测试(线性回归法)中使用模型 𝑟 = 𝛽𝑋 +𝑐 (r 是股票收益率,X 是因子暴露度,c 是常数项,c 可以理解为市场因子)并且假设我们 在计算因子 IC 值的时候,不预先对因子暴露度进行市值、行业调整了,就使用原始的因 子暴露度 X,则本期因子 IC 值为𝑐𝑜𝑟𝑟(𝑋,𝑟),根据引理,因子 IC 值的平方就等于单因子测 试的回归模型的𝑅^2。

所以,因子 IC 值本质上反映的是下期收益率和本期因子暴露度的线性相关程度(𝑅^2的平方根),是使用该因子预测收益率的稳健性(IC 值越大,这个因子的收益越稳定,波动越 小);而回归法中计算出的因子收益率本质上是一个斜率,反映的是从该因子可能获得的收益率的大小,这并不能说明任何关于线性拟合优度的信息(也就是说,因子收益率很大 时,也可能出现𝑅^2很小的情形);至于回归法中计算出的 t 值,在一元线性回归中 t 值与𝑅^2 反映的信息一致(二者对应关系为,当𝑅^2 = 0时 t 值也为 0,当𝑅^2 = 1时 t 值为无穷大), 但是由于我们所采用的回归模型包括了行业变量,所以 t 值仅代表被测因子对股票收益的 解释能力(而不能代表模型的整体拟合优度) 。

总结一下,IC 值反映模型整体线性拟合优度,t 值反映被测单因子对模型的解释能力是否 显著,因子收益率与前两者差别较大,它反映的是可能获得的收益率的大小,而对这个收 益是否稳健未知。

事实上,我们在计算因子 IC 值时也对因子暴露度进行市值、行业预调整了,情况还比上面分析的要复杂一些,但是精髓不变,我们的
结论仍然大致正确。

分层模型回测
依照因子值对股票进行打分,构建投资组合回测,是最直观的衡量指标优劣的手段。一般 来说,通过回归法和计算因子 IC 值都无法确定因子的单调性(例如,某因子值排名在中 间 1/3 的个股表现比前 1/3 和后 1/3 的个股表现要好),但是分层回测法是可以确定因子单 调性的。分层回测法逻辑简单,结果清晰,操作方便,并且具有能区分因子单调性的独特 优势,是接受度非常高的一种单因子测试手段。

测试模型构建方法如下:

  1. 股票池、回溯区间都与回归法相同。
  2. 换仓期:在每个自然月最后一个交易日核算因子值,在下个自然月首个交易日按当日 收盘价换仓。
  3. 数据处理方法:不进行任何加工,因子值为空的股票不参与分层。
  4. 分层方法:在每个一级行业内部对所有个股按因子大小进行排序,每个行业内均分成 N 个分层组合。如图表 6 所示,黄色方块代表各行业内个股初始权重,可以相等也可 以不等(我们直接取相等权重进行测试),分层具体操作方法为 N 等分行业内个股权 重累加值,例如图示行业 1 中, 5 只个股初始权重相等(不妨设每只个股权重为 0.2), 假设我们欲分成 3 层,则分层组合 1 在权重累加值 1/3 处截断,即分层组合 1 包含个 股 1 和个股 2,它们的权重配比为 0.2:(1/3-0.2)=3:2,同样推理,分层组合 2 包含个 股 2、3、4,配比为(0.4-1/3):0.2:(2/3-0.6)=1:3:1,分层组合 4 包含个股 4、5,配比 为 2:3。以上方法是用来计算各个一级行业内部个股权重配比的,行业间权重配比与 基准组合(我们使用沪深 300)相同,也即行业中性。
  5. 评价方法:回测年化收益率、夏普比率、信息比率、最大回撤、胜率等。

image

单因子测试结果分析

分层模型回测分析方法

在华泰单因子测试系列前两篇报告中,我们用图表夹杂文字说明的形式,对各个细分因子 的分层回测结果一一进行了详细展示。从第三篇报告《华泰单因子测试之动量类因子》开 始,我们对报告展示形式加以改进,在维持前两篇测试报告的细致程度的基础上,为了更 高效地展示结果,我们会在此处集中说明所有图表的计算细节和分析方法,后面细分因子 的测试结果均会使用相同的模板,便于读者速览和对比。

分层测试详细展示图表包括:
1. 分五层组合回测绩效分析表(20050509~20170228)。其中组合 1~组合 5 为按该因 子从小到大排序构造的行业中性的分层组合。基准组合为行业中性的等权组合,具体 来说就是将组合 1~组合 5 合并,一级行业内部个股等权配置,行业权重按当期沪深 300 行业权重配置。多空组合是在假设所有个股可以卖空的基础上,每月调仓时买入 组合 1,卖空组合 5。回测模型在每个自然月最后一个交易日核算因子值,在下个自 然月首个交易日按当日收盘价调仓(分层组合构建法等更多细节参见上一章“分层模 型回测”小节)。 2. 分五层组合回测净值图。按前面说明的回测方法计算组合 1~组合 5、基准组合的净 值,与沪深 300、中证 500 净值对比作图。 3. 分五层组合回测,用组合 1~组合 5 的净值除以基准组合净值的示意图。可以更清晰 地展示各层组合在不同时期的效果。
4. 组合 1 相对沪深 300 月超额收益分布直方图。该直方图以[-0.5%,0.5%]为中心区间, 向正负无穷方向保持组距为 1%延伸,在正负两个方向上均延伸到最后一个频数不为 零的组为止(即维持组距一致,组数是根据样本情况自适应调整的)。
5. 分五层时的多空组合收益图。再重复一下,多空组合是买入组合 1、卖空组合 5(月 度调仓)的一个资产组合。多空组合收益率是由组合 1 的净值除以组合 5 的净值近似 核算的。
6. 分十层组合回测时,各层组合在不同年份间的收益率及排名表。每个单元格的内容为 在指定年度某层组合的收益率(均为整年收益率),以及某层组合在全部十层组合中的 收益率排名。最后一列是分层组合在 2006~2016 的排名的均值。
7. 不同市值区间分层组合回测绩效指标对比图(分十层)。我们将全市场股票按市值排名 前 1/3,1/3~2/3,后 1/3 分成三个大类,在这三类股票中分别进行分层测试,基准组 合构成方法同前面所述(注意每个大类对应的基准组合并不相同)。
8. 不同行业间分层组合回测绩效分析表(分五层)。我们在不同一级行业内部都做了分层 测试,基准组合为各行业内该因子非空值的个股等权组合(注意每个行业对应的基准 组合并不相同)。

另外,我们在进行分层测试详细展示之前,先对各种计算公式下的波动率因子进行了样本 期长度敏感性测试,确定最佳样本期长度,再“择优”展示该种计算公式下的某个效果较 好的细分因子。

日收益率序列标准差因子
该类因子的定义为过去一段时间内个股日收益率序列的标准差(剔除停牌的交易日),我 们首先对该类因子进行样本期长度敏感性测试,确定最优样本期长度。在以下图表中, std_Nm(N=1,2,……,10)代表样本期为过去 N 个月,std_Nd(N=60,65,……,100)代表 样本期为过去 N 个交易日。虽然 std_1m 的 IR 比率最高,但当样本期比较短时,分层组 合的换手率非常高,交易成本很高(按单边换手率 0.3%计算交易成本),所以综合考虑, 在实际选股应用中,还是 std_4m 最佳。在后两页的图表中,我们对 std_4m 进行了详细 的测试并展示结果(各项图表内容解释请参看本章第一小节)。

image

特质波动率因子
特质波动率因子将股票的系统风险与公司层面的特质风险剥离开来,一般可以简单基于 CAPM 模型计算股票特质波动率,即为过去一段时间内个股日收益率序列对市场组合(我 们这里采用中证全指)日收益率序列进行一元线性回归的残差的标准差(剔除停牌的交易 日)。我们首先对该类因子进行样本期长度敏感性测试,确定最优样本期长度。在以下图 表中,id1_std_Nm (N=1,2,……,10) 代表样本期为过去 N 个月,id1_std_Nd (N=40,65,……,75)代表样本期为过去 N 个交易日。与上一小节情形类似,虽然 id1_std_1m 的 IR 比率最高,但其对应的分层组合的换手率也非常高,交易成本很高(按 单边换手率 0.3%计算交易成本),所以综合考虑,在实际选股应用中,还是 id1_std_3m 最佳。在后两页的图表中,我们对 id1_std_3m 进行了详细的测试并展示结果(各项图表 内容解释请参看本章第一小节)

image

特质波动率的度量方式有许多种,对于上述 id1_std_Nm 因子,我们实际上是使用 CAPM 回归残差序列的标准差进行计算,类似地,我们其实还可以更精细地使用 Fama-French 三因子模型的回归残差序列的标准差进行计算。三因子与 CAPM 比较,相当于新引入了 规模因子和账面市值比因子,我们此处也遵循此思路略加尝试。

接下来,我们提供第二种计算特质波动率因子的公式,即为过去一段时间内个股日收益率 序列对市场组合(我们这里采用中证全指)日收益率序列、规模因子日收益率序列、账面 市值比因子日收益率序列进行多元线性回归的残差的标准差(剔除停牌的交易日)。其中, 规模(或账面市值比)因子日收益率的计算方法为前一日市值(或 PB)排后 30%的股票 的本日收益均值减去前一日市值(或 PB)排前 30%的股票的本日收益均值。我们将此种 特质波动率因子记为 id2_std_Nm。

在此之外,我们还可以计算上述残差序列的上行波动率、下行波动率。若设残差序列为 (𝑟1, 𝑟2,⋯, 𝑟𝐾)′,则上行波动率的计算公式为

image

下行波动率的计算公式即把上式中求和号的条件改为𝑟𝑡 < 0。我们将上行、下行波动率分 别记为 id2_std_up_Nm、id2_std_down_Nm,然后将此二者分别相减、相加得到衍生因 子 id2_std_umd_Nm、id2_std_upd_Nm。

同样地,我们首先对因子的样本期长度进行敏感性测试。结果显示,在回归法、IC 值测试 中,这五种因子都是 1 个月最佳,id2_std_1m、id2_std_up_1m、id2_std_down_1m、 id2_std_umd_1m、id2_std_upd_1m 的 IR 比率分别为 0.88、0.92、0.85、0.74、0.90。 从 IR 比率来看,它们的表现都是非常优秀的,我们可以回忆一下,在动量类因子的单因 子测试报告(华泰多因子系列之四)中 return_1m(一个月反转)的 IR 比率是 0.63,改 进的反转因子 wgt_return_1m(一个月内日换手率乘以日收益率的算术平均值)的 IR 比 率是 0.92,这已经算是以前测过的估值、成长、动量、换手率因子中效果最好的。虽然这 些因子的 IR 比率很高,但其对应的分层组合的换手率也非常高(TOP 组合月均双边换手 率都在 120%以上),交易成本很高(按单边换手率 0.3%计算交易成本),所以综合考虑, 在实际选股应用中,还是三个月左右样本期效果较好。

在分层法参数敏感性测试图表中,我们还可以发现,考虑交易成本后,这些因子对样本期 长度其实并不敏感。虽然随着样本期长度增加,因子的效果有所下降,但 TOP 组合换手 率也在逐渐下降,这意味着交易成本在逐渐降低,两种效果相互作用下,TOP 组合的年化 收益率和夏普比率都没有发生太大变化。

在后两页的图表中,我们对 id2_std_3m、id2_std_up_3m、id2_std_down_3m、 id2_std_upd_3m 进行了详细的测试并展示结果。



image

image

image

以下是 id2_std_upd_3m 因子详细测试结果(各项图表内容解释请参看本章第一小节):

image

日内最大涨/跌幅波动率因子
前两小节中波动率因子都是利用日频(复权)收盘价计算的,在本小节中,我们引入日频 的最高/最低价信息,定义四种波动率类因子:

  1. high_r_std_Nm(N=1,2,……,10),即在过去 N 个月内,用个股每日最高价除以前一 日收盘价计算日内最大涨幅(此处有复权处理),再计算最大涨幅序列的标准差;
  2. low_r_std_Nm(N=1,2,……,10),即在过去 N 个月内,用个股每日最低价除以前一 日收盘价计算日内最大跌幅(此处有复权处理),再计算最大跌幅序列的标准差;
  3. hml_r_std_Nm(N=1,2,……,10),等于 high_r_std_Nm 减去 low_r_std_Nm; 4. hpl_r_std_Nm(N=1,2,……,10),等于 high_r_std_Nm 加上 low_r_std_Nm。

我们首先对这四种波动率类因子进行样本期长度敏感性测试,如下所示:

从以上图表我们可以看出,high_r_std_Nm 因子的选股效果大幅好于 low_r_std_Nm,即从某 种角度来讲,个股“上方”波动率的预测能力好于“下方”波动率,两侧波动率的效果并 非对称的。若考虑通过加/减法将这两种波动率结合起来,可以发现,hml_r_std_Nm(相减) 的效果好于 hpl_r_std_Nm(相加),hml_r_std_1m 的 IR 比率高达 0.87,但其对应的分层 组合中 TOP 组合的月均双边换手率为 159.46%,交易成本很高(按单边换手率 0.3%计算 交易成本),所以综合考虑,在实际选股应用中,还是 hml_r_std_5m 最佳。同时,日内 最大涨幅波动率因子中的 high_r_std_4m 也具有比较好的选股效果,在后两页的图表中, 我们对 high_r_std_4m 和 hml_r_std_5m 进行了详细的测试并展示结果。

以下是 high_r_std_4m 因子详细测试结果(各项图表内容解释请参看本章第一小节):

image

以下是 hml_r_std_5m 因子详细测试结果(各项图表内容解释请参看本章第一小节):

image

回归法测试结果分析

上一章中,我们选择性展示了八个波动率因子分层回测的结果,本章我们将使用回归法进 行截面规律统计。回归法是多因子模型领域应用最广的方法,回归法单因子测试的结果不 仅用于初步因子筛选,在后续构建收益预测模型时还会进一步应用。具体模型设置和下面 图表中各指标含义参见第二章“单因子测试流程”的第一小节“回归法”。我们还列出了 前期报告因子回归测试结果(估值、成长、动量类因子)与本期波动率类因子回归结果进 行对比,如下所示。

从上面的图表可以看出,波动率因子的整体效果都还不错。取假设检验 H:因子收益率序 列均值显著异于 0。则假设检验 H 对应的 t 值在上表中最后一列,所有列举出的八个波动 率因子都能通过该假设检验。如果从回归法得出的因子收益率均值来看,特质波动率因子id2_std_3m、id2_std_up_3m、id2_std_down_3m、id2_std_upd_3m 表现稍好,而且从 图中可以发现,id2_std_up_3m(上行波动率)、id2_std_down_3m(下行波动率)效果 基本对称;另外,hml_r_std_5m 虽然因子收益率均值不是很大,但在回测区间内累积收益 率比较平稳,基本没有明显失效的时段。整体而言,波动率类几个细分因子表现相差不大, 累积收益曲线形态也比较趋同。

与前四篇单因子测试的报告结果进行对比,我们发现波动率因子的整体效果比估值、成长 因子要好,与换手率因子相差不远,但不如动量反转因子。这里需要额外说明,如上图表 中所有因子的测试结果都是立足当前时点重新计算的,所以结果与之前报告中不完全一样。

因子 IC 值的计算与分析

在回归法因子测试完成之后,我们还将进行因子 IC 值的计算与分析。请注意,我们此处 计算的因子 IC 值并不是因子原始暴露度和下期收益的相关系数,而是“经过市值和行业 调整的”因子暴露度和下期收益的相关系数(具体计算方法详见第二章“单因子测试流程” 的第二小节“因子 IC 值的计算”),所以因子 IC 值的计算结果和回归测试结果并不是完全 一致的(回归模型中包含行业哑变量而不包含市值相关解释变量)。

我们还仿照回归法分析过程,画出各因子 IC 值累积曲线,可以从图中观察波动率因子在 各段历史时期的表现。

下面图表中 IR 比率是指因子 IC 值均值与标准差的比值的绝对值,能够衡量因子有效性。 因子 IC 值的分析结果与回归法基本一致,综合来看特质波动率因子 id2_std_3m、 id2_std_up_3m、id2_std_down_3m、id2_std_upd_3m 表现稍好,id2_std_up_3m(上 行波动率)略微强于 id2_std_down_3m(下行波动率)。从 IR 比率来看,几类因子的有 效性排序为:动量反转>换手率、波动率>估值、成长(若采用较短样本期,波动率因子的 IR 比率与换手率因子基本相当)。

波动率因子效果对比总结

我们将分层测试的结果汇总在下面图表中,其中 TOP 组合是指分五层组合中的组合 1。 从 TOP 组合信息比率、多空组合年化收益率、多空组合夏普比率、因子单调性等角度来 说,我们推荐 id2_std_3m、id2_std_up_3m、id2_std_upd_3m、hml_r_std_5m 因子,但 总体来说,波动率类细分因子的表现差异不明显。

这里需要指出的是,我们在前期报告中分层测试均没有考虑交易成本,本报告中首次加入 交易成本(单边换手率 0.3%)的计算,以使结果更贴近真实选股情况。观察下面图表可 以发现,估值、成长类因子的 TOP 组合换手率都不算太高,因此扣除交易成本后 TOP 组 合收益率比之前报告中降低得不多,其中 BP 因子的 TOP 组合表现很好,年化收益率超 过 30%。与之相对的是,动量反转类因子的 TOP 组合换手率非常高,扣除交易成本后收 益降低较多。在列举的四个动量反转类因子中,exp_wgt_return_6m 表现最好,不过它能 否代表动量反转类因子的最优水平尚未可知,我们将在后续报告中集中对所有类别因子进 行扣除交易成本的分层选股测试,从一个新角度寻找每类因子中的最佳细分因子。

对于换手率因子而言,turn_1m、std_turn_1m 因子的 TOP 组合在扣除交易成本后没有超 额收益(基准组合的年化收益率为 23.7%,基准组合的构建方式为行业内部所有个股等权、 行业权重按沪深 300 指数配比,每月调仓一次)。bias_turn_1m、bias_std_turn_1m 因子 的 TOP 组合还是有一定超额收益的,但效果也不太突出。

对于本文中详细测试的波动率类因子,由于我们进行了参数优化,所以列举出的八个因子 TOP 组合年化收益率已经达到当前波动率因子库中的最优,基本均在 28%上下,这一水 平可说能超过大部分估值、成长、换手率类因子(BP 除外),可能不如动量反转(反转因 子将在后续报告中再详加测试)。

如果从 IR 比率的角度来看,几类因子的有效性排序大致为:动量反转>换手率、波动率> 估值、成长。不过前面刚刚讨论了,换手率因子在 Alpha 端的选股能力有限,而 A 股市场 不具有良好的做空机制,所以还需正确看待各类因子的 IR 表现。

本报告最后一张图为目前已测的各大类因子 IC 序列的相关系数矩阵。请注意,我们这里 对所有因子进行了方向调整,将所有逻辑上是负向的因子均乘以-1 使其变为正向因子再去 计算 IC 序列。从图中可以看出,基本上只有各大类内部细分因子相关性比较严重,大类 间只有动量反转、波动率、换手率因子相关性稍微严重一些。因为股票市场本来就是量价 联动的,所以这也符合逻辑,这些因子也可以合称为市场交易类因子。还可以发现一个有 趣的现象,估值因子中的 EP、EPcut 及成长因子收益率大体上与其余类别因子收益率均 呈负向关系。在后续构建多因子组合的报告中,我们还会对此现象详加讨论。

image

目前我们正在陆续推出单因子测试系列报告,后续规划包括财务质量因子、杠杆因子、规 模因子、分析师情绪因子、股东因子、技术因子等大类因子的测试,在单因子测试系列之 后我们将深入探讨如何在大类因子中进行因子精选并赋予合适权重从而构造优秀的风格 因子,敬请关注。