【量化研报分享】东方证券-因子选股系列报告之六十八:因子加权过程中的大类权重控制-20200804


(adhaha111) #1

摘要

传统的基于大类因子的因子加权方法可以抽象成简单的神经网络,指定损失函数后可以以一个时间截面数据作为批量通过基于梯度的优化算法学习大类因子内部的权重和大类间的权重。

在一定的情形下,最小化预测收益率和实际收益率的均方误差等价于最大化ZSCORE 的 IC,基于均方误差学习参数相当于找到一组参数使得模型ZSCORE 过去一段时间的平均 IC 最高。

如果不考虑大类因子的标准化层,基于大类的线性网络和简单线性网络等价,但之所以依然采用大类网络在于这种设计下更便于我们实践中对各个大类因子进行直接或者间接的干预。

我们尝试了对量价总个大类的权重进行适当的控制,发现在对大类因子进行适当程度的干预后虽然 ZSCORE 的 RankIC 和多空组合都会变弱,但指数增强组合的实际业绩却有不同程度的提升。

大类等权是一种常见的保守型加权方法,大类间虽然等权,但大类内部可能涉及多种不同的加权方法,等权、ICIR 加权、最大化 IC 加权等常见的合成大类的方法并没有充分考虑各个大类因子间的相关性,因此合成的单个大类因子可能表现很好,但大类等权的结果却不一定更佳。

通过大类网络一体化学习大类等权中各个大类因子内部权重的方法会充分考虑各个大类因子之间的相关性情况,实现多因子最优而不是单个大类因子表现最优,但是大类因子间相关性的大幅变化可能导致各大类因子对 ZSCORE的实际贡献可能和传统的大类等权有一定程度的差异,大类因子权重的设置需综合参考组合的收益、风险、换手等信息。

通过 ALE Plot 方法分析不同大类等权方式下 ZSCORE 对各大类因子的依赖情况,我们发现虽然各个大类因子合成 ZSCORE 的权重一样,但对 ZSCORE的实际贡献依然有较大差别,通过一体化学习的大类等权倾向于降低ZSCORE 对过去表现较差的大类因子的依赖。

我们可以将收益率预测问题转换为分类问题,采用二元交叉熵损失函数作为学习的目标,学习股票截面收益排名靠前的概率,实际测算下来相对学习均方误差损失,增强组合表现占优。但需要注意的是,二元交叉熵损失函数学习的股票排名靠前的概率和 ZSCORE 的 RankIC、增强组合收益并没有明确的关联,上述结果可能有数据依赖。