机器学习视角下的考察:因子拥挤度指标及其择时作用-招商证券-20200202
由alkaid创建,最终由alkaid 被浏览 116 用户
摘要
美国市场对于因子拥挤度指标的重视源于2009年动量因子(Momentum Factor)的大幅回撤,研究者认为因子拥挤度可能是影响因子寿命的重要原因。在国外研究的基础上,我们构建了估值价差、配对相关性、因子波动率、因子长期反转等8个因子拥挤度指标,并分别用这些指标对单因子收益方向和多因子组合权重进行了择时。在单因子择时方面,我们使用了XGBoost和LSTM两种机器学习算法,但是并没有取得明显优于纯做多方式的结果。我们又使用合成指标对多因子模型的权重进行调整,最后根据拥挤度指标加权后的多因子模型小幅战胜了因子等权组合的模型。
正像建筑师在设计公共建筑主体时,兼顾商业价值和美观之余,需要着重考虑所需容纳人口的拥挤度,投资者在研究因子策略的时候,需要关注现有的因子拥挤度和资金容量上限。
过多的资金追逐同一资产可能会引发尾部风险,因而国外十分重视对于因子拥挤度研究。国外的研究认为因子拥挤度指标本身并非一个因子收益的负向指标,因为必须有资金流入才能推动因子有优秀的收益表现。只有在某个时期有过多的资金聚集在某个因子上的时候,才会使得因子过于拥挤。
在国外研究的基础上,我们试图探索因子拥挤度指标是否能在国内市场上对因子进行有效择时。我们构建了4类描述因子拥挤度的相对值指标,分别是估值价差、配对相关性、因子波动率、因子长期反转(共8个指标)。在A股市场,因子拥挤度指标对跟因子的多空收益相关性并不单调。
随后,我们分别利用了两种机器学习方法(XGBoost和LSTM)基于因子拥挤度指标对单因子未来一周的收益方向进行择时。调用2009年以来的数据作为训练和测试的样本,对每个因子分别建立预测模型,在测试集中评估模型的准确性。由于国内的因子多空收益的Alpha属性非常显著,利用模型对单因子收益方向进行预测的胜率并不高于每期都做多的简单策略的准确性。
我们随后用主成分分析法(PCA)降维合成因子拥挤度单一指标,该指标与因子多空净值走势呈现正相关性,我们以该指标加权构建多因子组合,加权后的组合多空净值小幅战胜等权的多因子组合。
总体而言,A股市场的因子拥挤度有一定的尾部风险警示作用,但是持续用于因子的择时效果并不突出。我们认为一个可能的原因是,A股市场的投资者结构中个人投资者居多,个人投资者在交易的时候很难形成同一方向的合力,因而在某些时段从合成指标上看因子拥挤度较高,但是即使在最高处,可能也远远没有达到这些常用因子的资金容量上限,不足以使因子发生尾部风险事件。因而在A股市场,因子拥挤度指标的指示作用并不显著。
正文
/wiki/static/upload/4a/4aacc831-917c-412f-9a6e-78d7abbae37e.pdf
\