【研报分享】天风证券:MHKQ 因子择时模型在 A 股中的应用

择时
标签: #<Tag:0x00007fc069fc7b10>

(anna) #1

MHKQ 因子择时模型在 A 股中的应用

常见多因子加权方式组合表现欠佳

今年以来,市值、反转、特异度等因子纷纷失效,由此导致基于长期 IC 均值或 IC_IR 等的加权方式不能及时适应市场短期的快速变化,从而导致构建的多因子组合遭受了较大的回撤。因此,因子择时即动态调整因子加权权重,才能够更好地适应市场的变化,从而获得比静态加权多因子组合更好的表现。

因子择时方法概览

本报告首先简单介绍现有的因子择时方法及观点,从基于因子自身特性进行因子择时以及基于外生变量进行因子择时两大类方法来概述因子择时的主要研究工作。基于因子自身特性的因子择时主要包括基于因子动量的择时方法及基于因子价值的择时方法,基于外生变量的因子择时主要包括基于条件期望的择时方法及基于分类模型的择时方法。

基于 AIC 筛选外生变量的条件期望因子择时模型

本报告介绍了 Ronald Hua, Dmitri Kantsyrev, Edward Qian 设计的基于条件期望的因子择时模型(简称 HKQ 模型),该模型能够同时考虑多个外生变量对于多因子组合的协同影响。模型的主要思想为根据联合正态分布的条件期望公式计算出给定当期外生变量取值时因子收益的条件期望值和协方差矩阵,然后在调仓时依据 AIC 信息准则筛选出拟合度较好的外生变量并计算当期因子的条件期望权重。

A 股市场基于 AICc 筛选的因子择时模型实证

本报告在 HKQ 模型的基础上,从市场交易类和宏观因素类外生变量中筛选了对于 A 股市场有较大影响的外生变量,进一步针对小样本上的外生变量筛选对原模型进行了改进,使用 AICc 进行外生变量的筛选,我们称为MHKQ(Modified HKQ)模型。通过回测,MHKQ 模型的组合表现相较于现有的多因子组合在今年以来有大幅提升,并且相对最大回撤有显著下降,今年以来的超额收益从-12.69%提升到了 15.34%,相对最大回撤从-13.92%下降到了-3.85%。

风险提示:市场环境变动风险,有效因子变动风险。

内容目录

  1. 因子择时方法简介
    1.1. 基于因子自身特性的因子择时
    1.2. 基于外生变量的因子择时
  2. 基于 AIC 筛选外生变量的因子择时框架
    2.1. 基于外生变量的条件期望模型
    2.2. 基于 AIC 的外生变量筛选
  3. A 股市场实证
    3.1. 外生变量集合
    3.2. 基于 AICc 的外生变量筛选方式
    3.3. 回测结果分析
  4. 总结
  5. 参考文献
  6. 风险提示

图表目录
图 1:IC 均值加权 Top100 组合净值及相对强弱
图 2:IC 均值加权复合因子各月末 IC
图 3:因子择时 Top100 组合净值及相对强弱
图 4:因子择时复合因子各月末 IC
图 5:因子择时 500 增强组合净值及相对强弱
表 1:七因子列表
表 2:IC 均值加权 Top100 组合历年表现
表 3:因子择时 Top100 组合历年表现
表 4:IC 均值加权组合与因子择时组合各月末因子权重及下月收益情况
表 5:因子择时 500 增强组合历年表现

今年以来,市值、反转、特异度等因子纷纷失效,由此导致基于长期 IC 均值或 IC_IR 等的加权方式不能及时适应市场短期的快速变化,从而导致构建的多因子组合遭受了较大的回撤。因此,因子择时即动态调整因子加权权重,才能够更好地适应市场的变化,从而获得比静态加权多因子组合更好的表现。本报告首先简单介绍现有的因子择时方法及观点,然后介绍其中一个基于条件期望的因子择时模型并在 A 股市场进行实证。

1. 因子择时方法简介

现有的因子择时方面的研究主要包括两大类,一类是基于因子自身特性进行因子择时,还有一类是基于外生变量进行因子择时。

1.1. 基于因子自身特性的因子择时

基于因子自身特性的因子择时主要有以下两种方法:

  1. 基于动量的因子择时:主要思想为近期表现较好的因子会受到市场追逐,未来一段时间可能会继续表现较好,形成因子动量效应。[Hoffstein 2016] 的主要做法为买入近期多头收益较高(剔除近一个月的过去 12 个月的因子多头收益率)的因子,实证表现能够提升收益率和夏普比。我们的上一篇报告《半衰 IC 加权在多因子选股中的应用》也是基于因子短期动量的思想,通过半衰 IC 加权来加强近期因子表现对于因子权重的影响。

  2. 基于价值的因子择时:主要思想为买入近期“便宜”的因子。[Hoffstein 2016] 用因子多头的股息率(滚动 5 年窗口内做 Z-Score)来衡量因子当前是否“便宜”,实证表现能够带来收益率和夏普比的提升。使用因子多空组合的价值(例如 BP)比率的变化方向作为衡量因子是否“便宜”的标准,当价值比率升高时,该因子相对更便宜。然而作者认为价值比率择时与价值因子本身高度相关,当多因子策略本身已经有价值因子时,价值比率择时并不一定能带来更高的收益和夏普比,反而会加重价值因子的总体占比而削弱整体表现。

1.2. 基于外生变量的因子择时

基于外生变量的因子择时主要有以下两种方法:

  1. 基于条件期望的因子择时:主要思想为认为因子收益和外生变量之间存在相关性,当给定外生变量取值时,可以求解出因子收益的条件期望。[Hua 2012] 假设因子收益和外生变量满足联合正态分布,在此基础上可以根据当期外生变量的取值计算出因子收益的条件期望值和条件期望协方差矩阵。另外作者基于 AIC(Akaike Information Criterion)进行外生变量的筛选,来降低模型的过拟合。

  2. 基于分类模型的因子择时:主要思想为基于决策树、逻辑回归等方式,基于外生变量取值对于是否使用该因子或因子暴露的方向进行训练,基于训练后的模型预测当期因子的暴露。 基于决策树来预测因子暴露的方向,实证表现能够大幅提升收益和收益回撤比。

2. 基于 AIC 筛选外生变量的因子择时框架

本报告首先介绍 Ronald Hua, Dmitri Kantsyrev, Edward Qian 设计的基于条件期望的因子择时模型(简称 HKQ 模型)。HKQ 模型的方法包括两个主要部分,首先是根据联合

正态分布的条件期望公式计算出给定当期外生变量取值时因子收益的条件期望值和协方差矩阵,然后在调仓时依据 AIC 信息准则筛选出拟合度较好的外生变量并计算当期因子的条件期望权重,下面我们分别对这两个部分进行介绍。

2.1. 基于外生变量的条件期望模型

传统的基于外生变量的因子择时模型一般是对于每个因子,筛选对于其预期收益有显著影响的外生变量。但是当有多个外生变量同时对因子预期收益有影响时,这种做法不能很好地刻画多变量对因子的协同影响。

常见的多因子组合构建时,通常以 IC 均值加权、ICIR 加权、最大化复合 IR 等方式进行加权,而因子择时的核心是如何动态调整因子加权的权重,即估计因子的收益或协方差矩阵。传统加权方式中的 IC 均值及 IC 协方差矩阵可以看作是因子收益及收益协方差矩阵的无条件期望,而引入外生变量对 IC 均值及 IC 协方差矩阵进行修正后,可以看作它们的条件期望。

1

2.2. 基于 AIC 的外生变量筛选

前面给出了在给定当期多个外生变量取值时因子的修正权重,而在实际投资中,投资者不可能把所有的外生变量都加入到模型中,加入过多的外生变量也并不一定能带来更好的结果,而且会产生样本内的过拟合问题。AIC 信息准则(Akaike information criterion)是一种常用的衡量统计模型拟合度优良性的方法,它鼓励数据拟合的优良性但是尽量避免出现过度拟合(Overfitting)的情况,所以优先考虑的模型应是 AIC 值最小的那一个。

2
3

3. A 股市场实证

下面我们对于 HKQ 模型在 A 股市场进行实证。针对 A 股市场的特点,本报告对原模型进行了如下几点的改进,修正后的模型我们称为 MHKQ(Modified HKQ)模型:

  1. 由于 A 股市场受市场交易行为以及宏观因素的影响较大,我们在原模型提供的外生变量基础上扩展到了 16 个外生变量,交易行为类外生变量扩展到了 7 个,宏观因素类变量扩展到了 8 个;

  2. 原模型使用最大化复合 IR 作为因子权重,其使用了条件期望均值和条件期望协方差矩阵,由于协方差矩阵的估计误差较大,为了降低协方差矩阵带来的估计误差,本报告直接使用条件期望均值 𝑅|𝑣 作为因子权重进行加权,读者可自行根据压缩估计等方法降低协方差矩阵的估计误差来测试最大化复合 IR 加权的效果;

  3. 由于样本窗口长度 𝑇 较小并且不显著大于外生变量数量 𝐾 ,原模型中基于 AIC 筛选外生变量的方法可能会产生较大的过拟合,而 AICc 在 AIC 的基础上增加了小样本的误差修正量,能够适用于小样本下的模型选择并保持较好的拟合度,因此本报告中基于 AICc 进行外生变量的筛选。

下面首先介绍我们回测使用的多因子组合,我们在规模、技术反转、流动性、波动性、估值、成长、质量等 7 个维度选取了 7 个典型因子来构建多因子组合,因子列表如下:

4

每个因子都采用 MAD(Median Absolute Deviation 绝对中位数法)方法进行边界压缩处理以剔除异常值,边界压缩后对缺失值视情况补其因子值为均值或 0,然后在横截面上对因子进行中信一级行业和对数市值的中性化回归,将回归后的残差项做 Z-Score 标准化处理后作为每只股票在该因子上的取值。

我们以上述 7 个因子构建组合,月末调仓,调仓样本空间符合以下条件:
 上市时间 6 个月以上;
 非 ST 股及 ST 摘帽后 3 个月以上;
 调仓当天收盘非涨跌停且非停牌。

回测参数如下:
 回测时间:2010 年 1 月 4 日~2017 年 7 月 31 日;
 每次选取样本空间中加权综合得分最大的 100 只股票等权分配权重作为持仓;
 交易成本双边 0.5%(买 0.2%卖 0.3%);
 因子加权方式:用过去 24 个月末的因子 IC 及外生变量取值作为输入,计算 AICc 筛选后的条件期望 IC 均值作为因子权重。

3.1. 外生变量集合

我们在 HKQ 模型提供的外生变量(包含涨跌幅类、利率类、日历类等)的基础上进行扩展,选择的外生变量集合如下,主要包括市场交易类变量和宏观类变量:
 涨跌幅类:上证 50 过去 20 个交易日涨跌幅、沪深 300 过去 20 个交易日涨跌幅、中证 500 过去 20 个交易日涨跌幅;
 时间序列波动率类:上证 50 过去 60 个交易日收益率标准差、中证 1000 过去 60 个交易日收益率标准差;
 截面波动率类:全市场股票单日收益率标准差,全市场股票过去 20 个交易日收益率标准差;
 利率类:SHIBOR1W、SHIBOR2W、SHIBOR1M、信用利差(1 年期中短期票据(AAA)收益率-1 年期国债收益率);
 货币类:M1 同比-M2 同比;
 通货膨胀类:CPI 同比-PPI 同比;
 工业产业类:采购经理指数 PMI、工业增加值当月同比 IAV;
 日历类:月份;

外生变量处理方式如下:
 由于 GDP 数据为按季度公布,而我们的观察时间为每个月末,因此我们选择了对于GDP 有较高预测能力且按月公布的 PMI 和 IAV 作为替代;
 由于货币类、通货膨胀类、工业产业类数据通常在次月公布,因此回测时在每个月末我们取上月公布的数据;
 在每个月末,月份的取值为下个月的月份;
 除月份外,其他的外生变量取值都取当期变量值在过去 24 个月末取值的相对位置并进行 min-max 标准化到 0~100 之间,即对于当期变量 𝑣𝑖,𝑡 标准化后的变量取值为

5

3.2. 基于 AICc 的外生变量筛选方式

当样本窗口长度 𝑇 较小,或者 𝑇 不显著大于外生变量数量 𝐾 时,基于 AIC 的方法可能会产生较大的过拟合,而基于 AICc(corrected AIC)进行模型选择的效果更好。AICc 在 AIC 上添加了一个小样本量的误差修正量
2𝐾(𝐾 + 1)/(𝑇 − 𝐾 − 1),即

6

当 𝑇 增加时,AICc 收敛成 AIC,所以 AICc 可以应用在任何样本大小的情况下。本报告中样本期为过去 24 个月末,并且有 16 个外生变量,因此本报告不使用 AIC 而使用AICc 来进行外生变量的筛选,筛选步骤和基于 AIC 的筛选步骤一致。并且经过回测发现,改进后的方法比原有方法有较大提升。

3.3. 回测结果分析

我们首先考察无条件期望下的传统多因子组合的表现。我们取过去 24 个月末的因子 IC 均值作为因子权重进行加权,选取综合得分 top100 的股票作为持仓,月末调仓。组合的净值及相对强弱如下图:

7

可以看到,今年以前该组合的相对强弱曲线一直保持上升趋势,而今年以来一直处于回撤阶段。该组合历年的表现如下:

可以看到,该组合在 2017 年以前能保持每年 13%以上的超额收益,而在市场变化较快的2014 年 底 相 对 于 中 证 500 指 数 产 生 了 -10.36% 的相对最大回撤 , 并且在20170110~20170731 一直处于相对回撤阶段,相对回撤达到了-13.92%。

下图展示了 IC 均值加权得到的复合因子每个月末的 IC。可以看到,复合因子长期以来表现较好,IC 均值为 0.136,ICIR 为 1.331,而今年年初连续 3 个月 IC 为负,这说明了长期有效的因子通过静态加权的方式并不能适应市场的快速变化,因子的权重只有随着市场的变化而及时动态调整才能获得更好的表现。

9

下面我们考察 MHKQ 因子择时模型的表现。我们以 AICc 筛选后的条件期望均值 𝑅|𝑣 作为因子权重,选取综合得分 top100 的股票作为持仓,月末调仓。组合的净值及相对强弱如
下图:

10

可以看到,该组合的相对强弱曲线一直保持上升趋势,该组合历年的表现如下:

可以看到该组合的表现较为稳定,年化超额收益 28.58%,收益回撤比 3.93,信息比 3.30,跟踪误差 7.39%,并且每年的超额收益稳定在 14%以上,历史相对最大回撤为-7.27%。今年以来超额中证 500 指数 15.34%,相对最大回撤-3.85%,对比表 2 中的 IC 均值加权组合的表现,今年表现有大幅提升。

下图展示了因子择时复合因子每个月末的 IC。可以看到,复合因子长期以来表现较好,IC均值为 0.132,ICIR 为 1.290,今年以来只有 1 个月的 IC 为负,这说明了因子择时模型能够适应环境的变化而动态调整因子权重,从而获得了更好的表现。

12

下表展示了 IC 均值加权组合和因子择时组合今年以来各因子配置的权重及方向,以及每月的超额收益情况。

今年以来对数市值、反转、特异度因子纷纷失效,IC 均值加权组合中这些因子的权重变化较为缓慢,不能适应市场的短期快速变化,这使得其在 4 个月末的复合因子 IC 为负,由此产生了较大的回撤,7 个月中只有一个月有正向超额收益。而观察因子择时组合,今年以来该组合配置了市值大的股票,对于反转、特异度因子的配置更加灵活,并且提升了ROETTM 和 BP 的配置权重,7 个月中有 6 个月都产生了正向超额收益。

下面我们以该因子择时模型对中证 500 指数做指数增强。指数增强常见做法为在月末调仓时对指数做行业中性化:
 对于中信一级行业的每个行业 𝑖,计算月末中证 500 指数成分股在该行业的股票数量𝑛𝑖 和行业权重 𝑤𝑖;
 计算上期持仓中该行业在月末停牌或涨跌停的股票的不可分配权重 𝑤ℎ;
 对于行业内选取综合得分最高的前 ⌈0.2 ∙ 𝑛𝑖⌉ 只股票等权分配行业内可分配权重,即
14

 单只股票的最大权重上限 1%。
我们以因子择时模型对中证 500 指数做行业中性化后的组合净值走势如下:

15

可以看到,该组合的相对强弱曲线一直保持上升趋势,该组合历年的表现如下:

可以看到,该组合年化超额收益 24.03%,收益回撤比 3.83,信息比 3.27,跟踪误差 6.38%,相对最大回撤-6.28%。可以看到,做完行业中性化后的跟踪误差和相对最大回撤都有下降。今年以来超额中证 500 指数 6.75%,相对最大回撤-3.76%。

4. 总结

今年以来,市值、反转、特异度等因子纷纷失效,由此导致基于长期 IC 均值或 IC_IR 等的加权方式不能及时适应市场短期的快速变化,从而导致构建的多因子组合遭受了较大的回撤。因此,因子择时即动态调整因子加权权重,才能够更好地适应市场的变化,从而获得比静态加权多因子组合更好的表现。

本报告首先简单介绍现有的因子择时方法及观点,从基于因子自身特性进行因子择时以及基于外生变量进行因子择时两大类方法来概述因子择时的主要研究工作。然后本报告介绍了 Ronald Hua, Dmitri Kantsyrev, Edward Qian 设计的基于条件期望的因子择时模型(简称 HKQ 模型),该模型能够同时考虑多个外生变量对于多因子组合的协同影响。该模型的主要思想为根据联合正态分布的条件期望公式计算出给定当期外生变量取值时因子收益的条件期望值和协方差矩阵,然后在调仓时依据 AIC 信息准则筛选出拟合度较好的外生变量并计算当期因子的条件期望权重。

本报告在 HKQ 模型的基础上,从市场交易类和宏观因素类外生变量中筛选了对于 A 股市场有较大影响的外生变量,进一步针对小样本上的外生变量筛选对原模型进行了改进,使用 AICc 进行外生变量的筛选,我们称为 MHKQ(Modified HKQ)模型。通过回测,MHKQ模型的组合表现相较于现有的多因子组合表现在今年以来有大幅提升,并且相对最大回撤有显著下降,今年以来的超额收益从-12.69%提升到了 15.34%,相对最大回撤从-13.92%下降到了-3.85%。

作者:天风证券金工团队