问答交流

【平台使用】为什么训练集抽取出来的数据比预测集少?

由bqo4psj8创建,最终由small_q 被浏览 8 用户

训练集三 年时间只抽取出14条数据。把训练集和预测集时间段设置成一样,训练集抽取出来的数据比预测集抽取出来的数据少很多

https://bigquant.com/codesharev3/5985ed02-6982-4879-a09e-f488d3501a11

因为在正常运行时候,发现训练集抽取出来的数据数量太少。找不到原因。然后试了下,预测集可以抽取到很多数据。后来把数据标注模块的过滤条件删除,把M3模块的时间段与M4模块的时间段设置成一样, 抽取出来的数据数量还是相差很多。下面是同样时间段下面抽取到的数据数量。






\

评论
  • 因为经过judge过滤后数据本身就很少了,然后在m2抽取标签的时候是基于m1的数据结果再合并后抽取,导致label很多为空的。所以有这种judge=1逻辑上过滤的,
  • 建议特征和标签单独抽取后再合并,可以参考如下:
  • undefined
  • https://bigquant.com/codesharev3/a9844858-356e-413f-a4d9-be51cee5d929
{link}