历史文档

【历史文档】算子样例-StockRanker训练曲线(Learning Curve)

由small_q创建,最终由small_q 被浏览 586 用户

更新

本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明

新版量化开发IDE(AIStudio):

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略:

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平台:

https://bigquant.com/wiki/doc/dai-PLSbc1SbZX

新版表达式算子:

https://bigquant.com/wiki/doc/dai-sql-Rceb2JQBdS

新版因子平台:

https://bigquant.com/wiki/doc/bigalpha-EOVmVtJMS5

使用

http://cdn.bigquant.com/community/uploads/default/original/3X/4/9/49250ebed9ec560923f8411ca323cef2d517ed1e.mp4

数据集

机器学习中,一般会遇到三类数据集:

  • 训练集 (Training Set),用于训练模型

  • 验证集 (Validation Set),从训练集学习的模型效果仅体现了训练数据,但不一定适合同类的其他数据,所以很多时候会在建模前会将数据分成两部分,一部分用作训练,一部分用作验证。验证可以用于模型参与调优、模型选择,有时候也称为 开发集。

  • 测试集 (Test Set),用于对最终模型进行无偏评估的数据集,用作最后模型测试

    {w:100}

训练曲线

学习曲线 (或 训练曲线 )显示训练过程中的效果,随着数据或者迭代等的变化,模型效果的变化情况。它是一种工具,它可以发现机器学习模型从添加更多训练数据或者迭代中受益多少。学习曲线的x轴是训练样本数或用于训练模型的迭代数,y轴表示效果。

StockRanker学习曲线

  • x轴:迭代次数(数的棵树)
  • y轴:训练的NDCG
  • 曲线:NDCG@n,表示前n个结果的NDCG
  • {w:100}

\

标签

训练集过拟合欠拟合StockRanker算法Stockranker
评论
  • NDCG指标一般要符合什么样的条件才能算好呢?
  • 测试数据集对模型会有影响吗?
{link}