研报&论文

Alpha预测之二,机器的比拼-东方证券-20190304

由qxiao创建,最终由qxiao 被浏览 85 用户

研究结论

Alpha因子库的不断扩容,让投资者有处理因子共线性、增加因子信息利用效率的需求,快速发展的机器学习模型为我们提供了解决这个高维预测问题的可行方案。本报告里测试了包括Elastic Net,SVR,RandomForrest、GBRT、ANN在内的17个模型,比较其预测能力和传统线性模型的异同。

报告里把个股超额收益率的预测拆为Dispersion 和收益率横截面zscore 两部分,前者用AR(1)模型预测,后者用alpha因子作为解释变量,通过机器学习模型预测,模型训练采用单月横截面并行训练的模式。这种拆分预测的方法效果好于直接用超额收益率作为预测目标。

我们使用自己因子库里51个alpha因子作为解释变量,历史回溯区间为2009.01-2018.12,并采用样本外Rsquared和DM检验来判断两个模型预测精度的相对高低。实证发现,“因子分类等权合成”的最基本方法,alpha预测能力最弱,显著弱于几乎其它所有模型。PCA降维、加ElasticNet惩罚项做正则化都能显著提升线性模型的预测精度。

非线性模型预测能力整体显著优于线性模型,GBRT和RandomForrest最佳;人工神经网络增加Hidden Layer层数和Neuron数量并不一定能提升预测能力;多个模型简单平均合并预测的方法效果更佳,显著优于单个模型。

投资策略组合可能有个股权重约束,无法事先获得个股权重,会出现权重大个股预测不准,预测准的股票权重小,导致模型预测精度无法反映到组合收益上的情况。这在中证500指数增强组合里表现尤为明显,“因子分类等权合成”方法预测精度最差,但增强组合超额收益不低,最为稳健。

机器学习模型偏好技术类因子,导致策略组合的换手率较高。事先筛选因子,减少技术类因子占比可以降低机器学习策略的换手,获取更高的超额收益,但策略的整体换手水平还是偏高,需要投资者有较强的交易成本控制能力,更适合中小资金的高频操作。

风险提示

量化模型失效风险

市场极端环境的冲击

正文

/wiki/static/upload/65/655577b8-f106-44e1-aab4-5ab7c4f9fc4b.pdf

\

标签

机器学习模型
{link}