【研报分享】海通证券:基于回归树的因子择时模型

因子择时
标签: #<Tag:0x00007fc07246c7d0>

(chau) #1

“海量”专题(134)——基于回归树的因子择时模型

近年来,随着常规因子波动性的提升,因子择时也逐渐受到投资者的关注。本文在前期研究的基础之上,放松了择时变量与因子收益线性相关这一假设,通过引入回归树构建因子择时模型。此外,本文还尝试将回归树因子择时模型与传统的因子收益动量模型结合在一起,并引入防御性因子择时的思路。

1 决策树与因子择时

在系列专题报告《选股因子系列研究(二十)——基于条件期望的因子择时框架》、《因子择时模型改进与择时指标库构建》中,我们讨论了因子择时模型的构建。通过假定因子收益与外生变量线性相关,模型使用当前的外生变量预测未来因子收益。然而,在实际的跟踪过程中,我们发现因子收益与外生变量之间并不完全线性相关。因此可考虑放松这一前提假设,可仅假定因子在不同的市场环境下具有不同的收益表现。该种择时思路类似于情景化因子择时,通过使用择时变量划分市场环境,并根据因子在不同市场环境下的表现对于未来因子收益进行预测。

基于该种因子择时思路,我们认为决策树较为适用。简单来说,决策树(Decision Tree)是一种用于分类以及回归的非参监督学习算法。在因子择时这一问题中,决策树可协助投资者将历史样本按照因子择时变量进行分类,并统计不同市场环境下因子的收益表现。投资者可根据拟合得到的决策树以及当前的市场环境对于因子未来收益进行预测。决策树又可进一步分类为,分类树(Classification Tree)与回归树(Regression Tree)。本文后续构建的模型主要基于回归树。

总体来看,决策树在因子择时中的用途多种多样。一方面,投资者可使用决策树从历史信息中提取出直观且容易理解的因子择时规则。投资者可结合自身的理解与研究对于相关因子择时规则进行修正。另一方面,决策树也可被应用于量化的因子择时策略中。本文第三部分以及第四部分讨论分析了量化策略的构建。

2 单因子择时回归树

本文采用横截面回归的收益率预测模型来计算复合因子,然后选择复合因子最大的100只股票构建组合。选用的因子为如下10个:市值、市值平方、反转、换手率、波动率、流动性、ROE、SUE、预期净利润调整、目标收益。本部分以市值因子为例,直观展示了使用历史数据构建得到因子择时回归树。更多关于其他因子的择时回归树可联系报告作者。下图展示了使用近5年数据计算得到的市值因子择时回归树。需要说明的是,本部分展示的市值因子收益为1单位小市值敞口带来的收益,也即因子收益为正,代表当期小盘效应更强。

观察上图不难发现,对数波动率对于近5年的市值因子收益具有较为明显的区分效果。在全区间来看,市值因子月均溢价为0.40%,但是在对数波动率高于阈值的情况下,市值因子月均溢价为1.10%,小盘效应较为明显,而在对数波动率低于阈值的情况下,因子月均溢价为-1.40%,大盘效应较为明显。下图展示了各环境下市值因子的净值走势。

观察上图可知,回归树模型对于近5年的市场环境有着较好的区分。当然,我们也可将分析区间进一步延长至10年。下图展示了使用近10年数据计算得到的市值因子择时回归树。

基于近10年的数据可以发现,对数市场波动对于因子收益依旧具有较为明显的区分效果。在全区间来看,市值因子月均溢价为0.50%,但是在对数市场波动高于阈值的情况下,市值因子月均溢价为0.80%,小盘效应较为明显,而在对数波动率低于阈值的情况下,因子月均溢价为-1.40,大盘效应较为明显。下图展示了各环境下市值因子的净值走势。

若投资者认为近期数据更能够体现出市场近期的逻辑,并应该给予更高的关注度,我们可在回归树模型中引入衰减加权的特性。下图展示了基于近5年数据并引入衰减特性后得到的因子择时回归树。

观察上图首先可以发现,波动率依旧是择时模型首要关注的择时变量。在对数波动率高于阈值的情况下,因子月均溢价为1.50%,小盘效应更加明显,而在对数波动率低于阈值的情况下,因子月均溢价为-0.60%,大盘效应更加明显。

此外,还可以发现,在不同的波动率环境下,模型后续关注的择时变量并不相同。在高波的环境下,择时模型会进一步观察期限利差变化。在期限利差扩大幅度高于阈值,短期流动性较向好的情况下,因子月均溢价会进一步上升至2.40%,小盘效应极为明显,而在期限利差扩大幅度低于阈值的情况下,因子月均溢价仅有0.60%。

在低波环境下,择时模型会进一步观察信用利差。在信用利差高于阈值,投资者风险偏好较低的情况下,因子月均溢价为-1.10%,大盘效应极为明显,而在信用利差低于阈值的情况下,因子月均溢价为0.70%。下图展示了因子净值在不同市场环境下的走势。

观察上图可以发现,在引入了衰减加权的特性后,模型对于近期数据具有更好的拟合,市场环境的划分也更加灵活。

3 因子方向性择时

回归树因子择时模型不仅能够协助投资者进行历史环境的划分,还可以协助进行因子方向性择时。本章首先探讨了回归决策树模型在因子方向性择时上的效果,然后引入了防御性因子择时的思路。

基于回归决策树模型可构建滚动模型进行因子方向性择时,具体步骤如下:

1)每个月基于历史5年数据训练回归决策树;

2)基于当前择时变量以及回归决策树得到因子收益预测;

3)根据因子收益预测方向,在相应的方向上暴露1单位敞口。

  下图对比展示了回归树因子择时组合、衰减回归树因子择时组合以及长期持有1单位小市值敞口的组合的累计溢价。

对比三个组合可以发现,长期持有组合收益性更强,但是波动性同样较强。在2017年市值因子转向的过程中,长期持有组合出现了巨大的回撤,两个因子择时组合的回撤相对更小。虽然两择时组合在2017年的回撤更小,但是择时组合在市值因子表现强势的2015以及2016年中却明显弱于长期持有组合。

总体来看,择时模型虽然在因子收益拐点处具有一定的灵活性,但是模型同样会因为频繁择时而在收益动量性较强的时段中损失收益。因此,放弃因子收益动量模型并完全切换至回归树择时模型并不现实。

4 防御性因子择时

基于回归树因子择时模型“灵活但缺乏稳健性”的特点,可尝试引入防御性因子择时的理念,将回归树择时模型与因子收益动量模型结合在一起。所谓的防御性因子择时,可理解为在预判因子收益存在较大不确定性时,关闭因子敞口,不承担风险,也不尝试获取收益。由于因子择时最终面向的是多因子模型,因此投资者并没有必要对于每个因子在每个月都有精准的预判。因此,对于确定性较高的因子暴露敞口,而控制不确定性较强的因子,是一种更加稳健的择时思路。

在常见的因子择时模型中,模型目标是在每个月都判定对因子的收益方向。这会导致模型在因子的方向预判上频繁变化,并产生损失。但是在防御性因子择时模型中,模型目标是在不确定的情况下控制因子敞口,因此即使判断错误,所产生的损失也会低于反向暴露敞口。本文通过引入双模型一致性判断来实现防御性因子择时。以因子方向性择时为例,可构建以下流程:

1)基于历史数据得到因子收益动量模型预测结果;

2)基于历史数据训练回归树,并基于最新择时变量得到回归树因子择时模型预测结果;

3)判断因子收益动量模型预测结果与回归树因子择时模型预测结果的收益预测方向是否一致。若一致,则在相应的方向上暴露1单位因子敞口,若不一致,则将当期因子敞口设定为0。

下列图表以市值因子为例,展示了12个月、24个月因子收益动量预测模型以及叠加了回归树因子择时模型、衰减回归树因子择时模型后的防御性因子择时模型的组合净值走势。

5 因子权重配置

防御性因子择时模型一方面可以被用于因子方向性择时,另一方面也可被用于因子权重分配。传统的因子加权方法,如IC法、最大化单期IC法或者回归法,都是基于因子收益预测的幅度进行因子权重的分配。因此,在进行因子权重调整时,同样可应用防御性因子择时的思路,进行因子权重分配。不妨以回归法加权为例,我们可构建以下因子加权机制:

1)基于历史数据得到因子收益动量模型的预测结果;

2)基于历史数据训练回归树,并基于最新择时变量得到回归树因子择时模型的预测结果;

3)判断因子收益动量预测结果与回归树预测结果的收益方向是否一致,若不一致,则当期因子最终收益预测设定为0,若一致,则使用回归树因子择时模型的预测结果作为最终收益预测;

4)基于因子最终收益预测以及当期因子值到股票收益预期。

可使用市值、中盘、换手率、反转、波动、估值、盈利以及盈利成长因子构建最大化收益预期TOP100组合,并对比收益动量模型以及防御性因子择时模型下组合的收益表现。下图对比展示了各组合相对于中证500指数的相对强弱。

简单来看,组合在应用了防御性因子择时模型后,年化收益出现了一定幅度的下降,但是组合在部分年份的收益表现产生了明显改善。对于灵活度较低的24个月因子收益动量模型,在叠加了防御性因子择时模型后,其组合表现在2017年产生了较为明显的改善。对于灵活度较高的12个月因子收益动量模型,在叠加了防御性因子择时模型后,其组合表现同样在2017年产生了一定幅度的改善。下表展示了各组合的分年度收益以及相对于中证500的超额收益。

6 展望

回归树模型虽然具有较为直观的优点,但是模型的稳健性依旧存在提升空间。投资者可通过集成化的方法(Ensemble Method)提升回归树的稳健性。简单来说,可通过平均法(Averaging)或者提升法(Boosting)进一步改进回归树模型。

7 风险提示

市场系统性风险、资产流动性风险以及政策变动风险会对策略表现产生较大影响。

作者:海通证券金工团队