随机森林模型优化调参的尝试
由small_q创建,最终由small_q 被浏览 225 用户
引言
之前的随机森林选股策略的回测效果并不是很好,笔者参考一篇硕士论文得到了因子选择的思路,对原有模型进行优化调参,得到了不错的回测收益效果。笔者将模型链接附到下方,方便大家可以尝试一下不同的因子组合。
/wiki/static/upload/f6/f60ca050-8291-48bb-9e28-fb650601f075.pdf
因子研究思路
优化思路
股票池筛选:
(1)剔除正在实施特别处理(ST)、特别转让服务(PT)的股票。
(2)剔除退市的股票,保留正常股票。
因子筛选:
(1)选取估值类因子、情绪类因子、技术类因子和动量类因子加入备选因子库。
(2)根据因子的信息系数均值、信息比率、因子排名自相关系数的相关数据,在30日持仓周期IC均值绝对值大于3%且显著为基本条件,结合分组平均超额收益的单调性以及其换手率高低的情况考虑是否加入有效因子池。
(3)基于相关性的冗余因子剔除
1、对具有类似经济含义的因子,采取历史收益加权法合并的方式以尽可能保留因子的 有效信息。
2、在剩余的有效因子中两两配对开展皮尔森相关检验,在具有高度相关性的因子间,剔除更不显著的那个。
原始模型
https://bigquant.com/experimentshare/307b1e56de4a49cfad405c8f4df78bb9
实验模型
https://bigquant.com/experimentshare/580a265298624b579eadf9bd3e97462f
原始回测结果
实验回测结果
参数组合1:
参数组合2: 参数组合3:
参数组合4: