前言
先贴第八周的结果 ^-^
总排名很低是因为我从第七期才加入,结果第七期没摸清门道,就拿了1分~~~
入门及前言可见 零基础《AI挑战虚拟股票预测大赛》入门教程
第七周的时候,还不确定公开和私有的测试数据之间的关系,就随意改了下预测,无限的过拟合公开测试集了。当时公开成绩第三名,私有成绩出来以后懵逼了~~~~
模型简介
在第八周的预测模型中,我采用了常规的stack方式,共集成了 xgboost, lgboost, rf 和 knn 四种模型。最后利用了lgb来集成模型。
模型优化
使用的所有模型,均是sklearn接口,都可以利用gridsearch调参,分别将各模型单独调至最优后,集成即可。
关于模型的集成,采用了两层的结构,实际上谨慎的做到三层也能极大的增强模型的预测能力,但我实现的版本中存在严重的过拟合。
集成采用了lgb,本地cv是0.68, 而一开始用了线性模型,本地cv 0.67.但是lgb版本的提交后,公开成绩反而下降。这也引出我们的结论:
结论
防止过拟合,相信本地cv
最后
广告位招租啊~~我看比赛中有两家量化投资公司十分辛苦的在刷排名,我们社区要不要当我的赞助商啊!