StockRanker训练曲线(Learning Curve)

stock_ranker
stock_ranker_train
stockranker训练曲线
视频教程
标签: #<Tag:0x00007fcf6393d7a0> #<Tag:0x00007fcf6393d660> #<Tag:0x00007fcf6393d4f8> #<Tag:0x00007fcf6393d3b8>

(iQuant) #1

使用

数据集

机器学习中,一般会遇到三类数据集:

  • 训练集 (Training Set),用于训练模型
  • 验证集 (Validation Set),从训练集学习的模型效果仅体现了训练数据,但不一定适合同类的其他数据,所以很多时候会在建模前会将数据分成两部分,一部分用作训练,一部分用作验证。验证可以用于模型参与调优、模型选择,有时候也称为 开发集。
  • 测试集 (Test Set),用于对最终模型进行无偏评估的数据集,用作最后模型测试

image

训练曲线

学习曲线 (或 训练曲线 )显示训练过程中的效果,随着数据或者迭代等的变化,模型效果的变化情况。它是一种工具,它可以发现机器学习模型从添加更多训练数据或者迭代中受益多少。学习曲线的x轴是训练样本数或用于训练模型的迭代数,y轴表示效果。

StockRanker学习曲线

  • x轴:迭代次数(数的棵树)
  • y轴:训练的NDCG
  • 曲线:NDCG@n,表示前n个结果的NDCG


(liujianliuku) #4

请问用滚动训练的话,怎么做这个切分呢


(supertrim258) #5

如果训练曲线一直很分散,是不是就是因子模型不收敛?过拟合?