随机森林分类

# 随机森林分类

使用随机森林模型求解分类问题,包含模型训练器和预测器。
定义

M.random_forest_classifier.v1(iterations,feature_fraction,max_depth,min_samples_per_leaf,key_cols='date,instrument',workers,other_train_parameters)

参数

  • Iterations(int)—树的数量,默认为10
  • feature_fraction(float)—特征使用率,寻找最佳分割时需要考虑的特征比率。。默认为1.0,即考虑所有特征。
  • max_depth(int)—树的最大深度,限制每棵树的最大深度,数值大拟合能力强,数值小则泛化能力强,设置0为不限制。
  • min_samples_per_leaf(int)—每叶节点最小样本数,一般值越大泛化能力越好。
  • key_cols(str)—关键列,指定的关键列会连同预测结果一起输出,多个列之间使用逗号分隔,默认为'date,instrument'两列。
  • workers(int)—并行作业数,同时使用多个进程进行计算,默认为1,普通用户最多为2,会员可以使用更多资源
  • other_train_parameters(dict)—其它训练参数,例如{‘criterion’:’mse’}

返回

训练模型
预测结果

返回类型

OutPuts