研报&论文

数据挖掘视角下的因子轮动初探-长江证券-20180609

由qxiao创建,最终由qxiao 被浏览 107 用户

摘要

数据挖掘因子轮动关系有自身的局限性和优越性

数据挖掘探究因子轮动,可以利用模型的优势找到更为精细的关系。由于因子轮动的数据量较小,容易过拟合,且逻辑层面较难给出解释。通过扩充数据量及分类模型的应用,降低信噪比和过拟合程度;通过抽取简单模型窥视变量和因子轮动的逻辑关系。

外生变量和因子有效区间有较大关系

根据市场环境变量和随机森林模型建立的因子择时策略相比于默认因子方向建立的策略,除动量因子外,均有提高。以因子择时为基础建立的多因子等权配置策略年化收益为4.76%,最大回撤1.17%,信息比5.11,Calmar比4.06。从树的结构来看,和因子是否有效最相关的变量为市场利率水平、市场波动率、市场流动性和市场资金面水平。

外生变量在因子选择上可以基本跟踪后验最佳三因子策略的收益

外生逻辑下因子选择策略年化收益为9.63%,最大回撤3.03%,信息比4.02,Calmar比3.18。因子选择规避了规模因子在2017年后半年明显失效的时期,基本规避了反转因子各个失效的时期

内生变量在因子选择上较后验最佳三因子策略有一定的提升

内生逻辑下因子选择策略年化收益为10.34%,最大回撤1.57%,信息比4.65,Calmar比6.58。因子选择规避了规模因子在2017部分失效的时期以及14年底的较大回撤,基本规避了反转因子各个失效的时期

正文

/wiki/static/upload/25/25958e2e-f84b-47d6-9466-7930a83c515b.pdf

\

标签

数据挖掘过拟合