人工智能43：因子观点融入机器学习

由kyrie_fu创建，最终由kyrie_fu更新于2022-07-29 05:24 被浏览 152 用户

摘要

本文构建了可融入因子观点的随机森林模型，提升了随机森林的灵活性

相比线性模型，机器学习模型的复杂程度大幅提升，模型对于历史数据的拟合能力变强，但灵活性下降。在动态演化的金融市场中，机器学习的这些特性使其备受挑战。为了提升模型的灵活性，我们改进了sklearn的随机森林模型，可指定优先分裂的因子来分裂决策树，从而人为增大优先因子的重要性。最后，我们以价值、成长、质量为优先分裂因子分别训练模型，构建了中证800价值、中证800成长、中证800质量三个组合，该测试能为构建结合机器学习的SmartBeta策略提供一种思路

面对量化投资中的挑战，如何提升机器学习的灵活性值得关注

2020年2季度，知名资产管理公司AQR发表了论文《Can Machines“Learn” Finance?》，文中列举了机器学习在金融投资领域面临的挑战：(1)模型的可解释性；(2)金融市场的低信噪比；(3)市场始终在演化。对于因子投资，在一个因子有效性持续变化的市场中，线性模型具有简单灵活的优势。而机器学习模型由于结构复杂，灵活性相比线性模型大幅下降。具体表现为模型在历史数据上训练好之后不易调整，一旦市场环境发生变化，模型面临失效的风险，投资者想调整却无从下手。因此，本文着重讨论如何改进现有机器学习模型来提升灵活性

随机森林模型改进：可指定优先分裂的因子

随机森林模型具有非线性拟合能力强和可解释性较强的优势，但对于动态演化的金融市场来说，标准的随机森林模型依然难以供投资者做主观调整。为了将因子观点融入模型，我们针对sklearn中的随机森林源码做了修改，使得模型中的决策树可在顶端的若干层根据指定的优先因子进行分裂，人为增大这些因子的重要性。改进后的模型新增了两个参数(1)speci_features：优先分裂的因子；(2)max_speci_depth：在决策树顶部使用优先因子分裂的层数

选股组合测试：以价值、成长、质量为优先分裂因子分别构建模型

本文使用改进后的随机森林模型构建特定风格的组合，主要选取三类风格因子为优先分裂因子：价值、成长和财务质量。在中证800成分股内，我们构建了中证800价值、中证800成长、中证800质量三个月频调仓的组合，测试了不同max_speci_depth下模型的表现。以价值因子为例，其他参数不变的情况下，随着max_speci_depth的增大，价值因子在模型里的重要性上升。本文的选股组合测试能为构建结合机器学习的SmartBeta策略提供一种思路

正文

/wiki/static/upload/11/11755b79-c2d5-4156-8fb9-a3c56c63e06f.pdf

人工智能43：因子观点融入机器学习

摘要

正文

标签