【AI挑战虚拟股票预测大赛】周冠军进阶教程

机器学习
用户成长系列
标签: #<Tag:0x00007fcf67b0d388> #<Tag:0x00007fcf67b0d248>

(lzl) #1

前言

先贴第八周的结果 ^-^

总排名很低是因为我从第七期才加入,结果第七期没摸清门道,就拿了1分~~~

入门及前言可见 零基础《AI挑战虚拟股票预测大赛》入门教程

第七周的时候,还不确定公开和私有的测试数据之间的关系,就随意改了下预测,无限的过拟合公开测试集了。当时公开成绩第三名,私有成绩出来以后懵逼了~~~~

模型简介

在第八周的预测模型中,我采用了常规的stack方式,共集成了 xgboost, lgboost, rf 和 knn 四种模型。最后利用了lgb来集成模型。

模型优化

使用的所有模型,均是sklearn接口,都可以利用gridsearch调参,分别将各模型单独调至最优后,集成即可。

关于模型的集成,采用了两层的结构,实际上谨慎的做到三层也能极大的增强模型的预测能力,但我实现的版本中存在严重的过拟合。

集成采用了lgb,本地cv是0.68, 而一开始用了线性模型,本地cv 0.67.但是lgb版本的提交后,公开成绩反而下降。这也引出我们的结论:

结论

防止过拟合,相信本地cv

最后

广告位招租啊~~我看比赛中有两家量化投资公司十分辛苦的在刷排名,我们社区要不要当我的赞助商啊!


(神龙斗士) #2

恭喜恭喜。赶紧赞助起来 :)


(lzl) #4

谢谢啦 ^^


(Henry) #5

这个公开成绩和私有成绩也是醉了,我公开成绩刷到了0.669,私有成绩直接干到了0.701.。。。


(Henry) #6

结论一样,相信本地CV


(lzl) #7

哈哈,我第一周公开成绩第三,私有成绩也是直接吃翔~~
我建议你这周可以试着简化模型~数据比较差,复杂模型本地cv高都不能相信的


(Henry) #8

好的,谢谢哈