【研报分享】渤海证券:多因子模型研究之三:风险模型与组合优化

多因子
标签: #<Tag:0x00007fc06f36ec50>

(chau) #1

多因子模型研究之三:风险模型与组合优化

核心观点:

 内容
1、之前发表的两篇报告中,我们介绍了多因子模型的单因子测试方法和收益预测模型。在本篇报告中,我们首先构建了多因子模型的最后一部分:风险预测模型。并在建立收益模型和风险模型后,综合两个模型的表现结果,对股票配置仓位进行二次优化。

2、风险模型构建的基本思路为,通过估计因子的协方差矩阵,刻画股票池的未来波动。多因子风险模型将个股风险转化为多因子模型的系统性风险以及股票本身的残差风险之和,减少了参数估计的数量和估计误差。

3、我们参考之前选出的 7 大类 12 个因子,使用 24 个月月频数据建立模型,在估计因子协方差矩阵时使用压缩矩阵算法对因子协方差矩阵进行压缩,分别以沪深 300、中证 500 以及全体 A 股作为股票池构建投资组合。沪深 300 优化组合对冲指数夏普比率 1.78,中证 500 优化组合对冲指数夏普比率 2.22,全体 A 股优化组合对冲指数夏普比率 2.31。

4、通过业绩归因模型,可以衡量投资组合的选股风格,确定投资组合的主要收益来源。以上文选出的沪深 300 股票池为例,对投资组合内股票进行业绩归因分析,可以发现模型选出的股票平均来看具有小市值、低估值、高盈利、高成长、低波动率、低换手率、前期涨幅较低的特点。其中市值因子暴露最大,波动率也最大。在市值因子上的过度暴露会在市场风格切换时带来一定风险。

5、通过对因子暴露的控制,可以得到针对特定因子中性的优化模型。我们构建了沪深 300 成分股针对市值中性的投资组合,进一步降低了组合波动率,提高了对冲业绩基准后的夏普比率。同理,我们还可以构建针对包括行业因子在内的一个或多个因子中性的组合。

6、截至本篇,我们用三篇系列报告,对多因子模型的整体构建流程做了完整的梳理。接下来,我们的研究重点将主要从寻找更为有效的因子、改进现有算法、构建因子择时模型三方面展开。通过引入宏观因素、统计指标、技术指标等多种方法对于原有模型进行进一步优化。结合行业轮动策略与大类资产配置,逐步构建成熟完善的投资策略。

目 录

1.概述
2.风险预测模型
2.1 理论介绍
2.2 风险模型的建立
2.3 针对不同基准的优化组合结果
2.3.1 针对沪深 300 成分股的优化组合结果
2.3.2 针对中证 500 成分股的优化组合结果
2.3.3 针对全体 A 股的优化组合结果
3.业绩归因模型
4.控制因子暴露后的组合优化模型
5.总结与未来研究方向展望

表目录
表 1:模型入选因子汇总
表 2:沪深 300 优化模型回测结果
表 3:沪深 300 对冲模型回测结果
表 4:中证 500 优化模型回测结果
表 5:中证 500 对冲模型回测结果
表 6:全市场 A 股优化模型回测结果
表 7:全市场 A 股对冲模型回测结果
表 8:沪深 300 优化模型业绩归因结果
表 9:沪深 300 市值中性模型回测结果
表 10:沪深 300 市值中性对冲模型回测结果
表 11:市值中性组合业绩归因结果

图目录
图 1:沪深 300 优化模型回测结果
图 2:沪深 300 对冲模型回测结果
图 3:中证 500 优化模型回测结果
图 4:中证 500 对冲模型回测结果
图 5:全市场 A 股优化模型回测结果
图 6:全市场 A 股对冲模型回测结果
图 7:沪深 300 市值中性模型回测结果
图 8:沪深 300 市值中性对冲模型回测结果

1.概述

通过之前发表的两篇报告,我们介绍了多因子模型的单因子测试方法和收益预测模型的构建方法。在单因子测试的报告中,我们对 93 个股票因子进行了显著性检测和分层回测,筛选出 7 大类共 12 个有效因子。在收益预测模型的报告中,我们首先对因子的共线性进行了处理,用因子合成和因子正交的手段将小类因子分别合并,对于合并后的因子建立均值、指数、压缩矩阵和逻辑回归四种收益预测模型,从算法原理上对四种模型的表现与选股风格进行了探讨。

将多因子模型真正运用到投资中时,仅仅使用收益预测模型往往是不够的,因为投资不仅关注收益,同时也关注风险。收益预测模型在选股时可能对于收益波动率较大的因子过分暴露,使最终选出的股票组合蕴含较大风险。所以,我们还需要建立风险预测模型,以控制股票池的整体波动。在建立收益模型和风险模型后,综合两个模型的表现结果,再对投资组合进行整体优化。组合优化模型可以表现为如下形式,该模型为经典二次优化模型的变体,可以直接求解:

1

其中 为待求解的组合权重,(1) 为待优化的目标函数,(2)-(6)需满足的条件限制。

  1. 2为收益预测模型给出的组合收益预测, 3 为组合风险预测,其中西格玛为后文介绍的风险预测模型给出的个股协方差预测矩阵, 为风险厌恶系数,取值越大,组合越偏向于保守风格;
  2. 为组合中股票的因子暴露矩阵, 为基准指数的股票权重,该条件限制了组合对于每个因子相对于基准指数的风格偏离范围,防止组合选出的股票风格过于雷同(例如有的收益预测模型给出的组合在市值因子上暴露过高,导致组合大中小盘股配比失衡);
  3. 为组合的行业暴露矩阵,当投资目标为行业中性时需要引入该限制条件,以限制组合相对于基准指数行业配置的偏离范围,使组合的行业配比与基准指数一致;
  4. 第四个条件限制了每只股票权重的上下限,因为 A 股不允许做空,一般个股权重下限设为 0,为防止收益过于集中,有时也会对个股权重设定上限;
  5. 第五个条件限定权重之和为 1。

2.风险预测模型

2.1 理论介绍

在组合优化模型的问题表述中,优化目标函数由两个部分组成。第一部分为组合的预测收益,在上一篇报告中,我们介绍了几种收益预测模型来解决该问题。第二部分为组合的预测风险,根据 Markowitz 组合理论,组合的风险是由组合的收益协方差矩阵决定的,而如何预测下一期组合的收益协方差矩阵就成为了风险预测模型需要解决的核心问题。

风险模型的一种估计方法,是直接选取组合中股票的历史收益率协方差矩阵作为 。但由于最终优化问题中要求协方差矩阵可逆,历史收益率需要考虑的时间跨度个数 N 必须大于组合中的股票数量 M。对于全市场几千只股票来说,如果使用月度收益率来计算协方差矩阵,则所需的回溯期 N 要超过几千个月,这对于历史相对短暂、市场风格变化迅速的 A 股来说比较困难。即使改为使用日度因子,需要估计的参数量依然在百万级别,误差过大,回测结果并不理想。另一种风险模型的估计方法来源于 Barra 模型,它将组合协方差矩阵分为两个部分:

4

其中 5 为组合中股票的因子暴露矩阵, 为因子收益率之间的协方差矩阵, 为个股残差波动率组成的对角矩阵。

Barra 风险模型将个股的风险转化为可以用多因子模型的系统性风险以及股票本身的残差风险之和。这样做可以大量减少需估计参数的数量,从估计几千支股票的收益协方差矩阵(数量级为 ),变为估计几十个因子收益协方差矩阵以及个股的残差(数量级为 )。Barra CSE3 文档中对于风险模型做了更精细的处理,包括采用日频数据、使用半衰期赋权、使用 Newey-West 算法处理股票日收益率的自相关性等。在本篇报告中,我们将算法进行了一定简化,使用 24 个月月频数据建立模型,并在估计因子协方差矩阵时使用压缩矩阵算法对因子协方差矩阵进行压缩,进一步降低估计误差。

2.2 风险模型的建立

风险模型中使用的风险因子并不一定要和预测模型中使用的 alpha 因子完全相同,不过在大多数时候,二者是一致的。 和 alpha 因子相比,风险因子要求在时间序列上的表现更为稳定,相关性更高,同时因子收益波动率尽量大。我们测试了在之前报告中选出的大类因子,发现其自相关性均大于 0.85,因子波动率在 0.2 左右,所以在接下来的部分,我们依然使用在之前报告中选出的因子建立风险模型。

2.3 针对不同基准的优化组合结果

2.3.1 针对沪深 300 成分股的优化组合结果

首先,我们对沪深 300 成分股应用上文介绍的风险预测模型进行组合优化,在优化时不考虑因子中性与行业中性控制。通过回测结果可以发现,随着风险厌恶系数λ的逐渐升高,模型波动率、换手率随之降低,但收益率也同时降低了。当时,对冲沪深 300 指数的表现相对最好,年化收益 11.09%,波动率 6.13%,夏普比率 1.78。

7


9

2.3.2 针对中证 500 成分股的优化组合结果

对中证 500 成分股应用上文介绍的风险预测模型进行组合优化,与沪深 300 相比,中证 500 成分股的波动率明显更大。且风险厌恶系数的降低对于收益率有显著提升。当 时,对冲中证 500 指数的表现相对较好,年化收益 23.43%,波动率 10.47%,夏普比率 2.22。

11


13

2.3.3 针对全体 A 股的优化组合结果

对全体 A股应用上文介绍的风险预测模型进行组合优化,由于全体 A 股涵盖股票的风格更为丰富,随着风险厌恶系数的变化,优化组合的风格变化也更剧烈。当时,组合对冲 Wind 全 A 的表现相对较好,夏普比率2.31。但由于市场中目前还不存在适合的对冲工具,在使用针对全体 A 股的优化模型时,我们更多的是关注没有对冲的选股结果,根据不同的风险承受能力,构建不同风格的投资组合。

1


3

3.业绩归因模型

业绩归因模型是用来衡量投资组合选股风格的模型。主要通过组合的因子暴露和因子收益来确定投资组合的主要收益来源。

5

为例上文选出的λ=5 的沪深 300 股票池为例,对投资组合内股票进行业绩归因分析,结果如下:

6

可以看出,模型选出的股票平均来看具有小市值、低估值(估值因子为 bp 和 ep,所以暴露为正代表选出的股票为传统意义上的低估值因子)、高盈利、高成长、低波动率、低换手率、前期涨幅较低的特点。在因子暴露上,可以看出该模型在市值因子上的暴露最大,其次为波动率和换手率为代表的交易类因子,再次为以盈利因子和成长因子为代表的基本面因子。所有因子中,市值因子收益波动率最大,且因子收益为正概率 46%,因子收益正负比接近 1:1。说明市值因子存在一定的不稳定性,在该因子上的过度暴露会在市场风格切换时带来一定系统性风险。

4.控制因子暴露后的组合优化模型

回顾在第 1 节中提到的组合优化模型:

7

通过对条件(2)中因子暴露的控制,可以得到针对特定因子中性的优化模型。在上面的业绩归因中,我们发现组合对市值因子的暴露存在一定的不确定性,为控制这种不确定性带来的风险,可构建针对市值中性的投资组合。

8 暴露与业绩基准(沪深 300 指数)一致,仅允许 1%至 5%的追踪误差。通过历史回测可以看出,市值中性模型相对于未做市值中性处理的原始模型来讲,收益率有一定降低,换手率降低,对冲业绩基准后的夏普比率有所提高。而对于追踪误差的暴露来说,1%-5%并没有显著变化。




对于做过市值中性后的投资组合,再次进行业绩归因(此处以因子暴露为 3%的组合为例),可以发现因子暴露已经大大降低。

13

同理,我们还可以构建针对包括行业因子在内的,一个或多个因子中性的组合。但是对于因子暴露过多的控制也可能会损失一部分收益,此处做过市值中性处理的组合的收益对比未做市值中性处理的组合就有了一定下降。组合优化模型的作用,很多时候并不是为了提高投资回报,而是对于投资组合的风格进行更精准的控制,根据不同的投资目标,匹配不同的模型,最终达到预想的投资效果。

5.总结与未来研究方向展望

截至本篇,我们用三篇系列报告,对多因子模型的整体构建流程做了完整的梳理。对几种常见的模型构建方法进行了测试,也为后续的一系列研究奠定了基础。接下来,我们的研究重点将主要从三方面展开。

  1. 寻找更为有效的因子:目前模型中使用的因子依旧以传统因子为主,现在国内外的研究中,已经开始构建更有效的新因子来代替原有因子。
  2. 模型算法的改进:在收益预测模型中,引入机器学习算法,提高模型有效性。
  3. 因子择时模型的构造:多因子模型以历史数据为基础,这就导致在市场风格急速转换时,多因子模型的调整会相对较为缓慢,这种滞后性短期有时会带来较大的收益回撤。为了应对这种情况,可以通过引入宏观因素、统计指标、技术指标等多种方法对于原有模型进行进一步优化。还可以结合行业轮动策略与大类资产配置,逐步构建成熟完善的投资策略。

作者:渤海证券金工团队