研报&论文

用机器学习解释市值:特异市值因子-东方证券-20170804

由qxiao创建,最终由qxiao 被浏览 67 用户

研究结论

在某个时点上的股票的横截面市值基本上都可以被公司的财务指标和市场因素所解释,也就是说市值解释模型依据了市场上股票的情况,给出了每个公司当期投资者认为的内生市场价值,而解释模型的残差部分,也就是当前市值和内生市值的差,代表了不可解释的部分。残差值越大,代表公司当前的市值向上偏离内生市值越多,那么公司的市值越倾向于回复到其内生市值,也就是说公司股价下跌的可能性越大,反之亦然,特异市值(残差值)是一个相对估值指标,因子值较小的股票在未来表现更好。

我们用线性模型构建了特异市值指标,发现虽然因子表现较好,但是增量信息不明显,究其原因是因为线性的方法没有办法解释市值与财务指标之间的非线性关系,所以导致回归的残差里面的信息不纯。

我们用随机森林模型构建了特异市值指标,从2007.1.1-2017.6.30,特异市值因子在中证全指的IC均值为-0.071,IR为-2.92,在中证500样本空间内,平均IC为-0.0569,IR为-2.26,在沪深300样本空间内,平均IC为-0.052,IR为-1.76,表现都非常好。

在剔除了传统的估值、成长、反转、非流动性等因子后,特异市值因子在中证全指的IC均值为有-0.023,IR为-1.81,多空组合年化收益率11.45%,信息比1.78,依然有着比较好的选股作用,说明特异市值是有增量信息的。

传统的机器学习通常应用在预测收益率上,然而信噪比较低,提升效果有限。本文把机器学习算法应用到了解释市值上,同期的财务数据对市值的解释度高达96%,且得到的特异市值因子表现优秀,算是一种把机器学习应用到金融领域的拓展。

风险提示

量化模型基于历史数据分析而得,随着市场的演进变化,模型存在失效的风险;

极端市场环境可能对模型效果造成冲击。

正文

/wiki/static/upload/f6/f6f988fb-114d-4c5a-8db0-e94057cf308a.pdf

\

标签

机器学习市值因子
{link}