极端随机森林—回归

# 极端随机森林-回归

本模块是对sklearn的封装,详细文档请参考: https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.ExtraTreesRegressor.html#sklearn.ensemble.ExtraTreesRegressor
定义

M.extra_trees_regressor.v1(criterion,iterations,feature_fraction,max_depth,min_samples_per_leaf,key_cols,workers,other_train_parameters)

参数:

  • criterion:必选,枚举,默认值mse,可选值['mse','mae'],决定分割的标准,支持均方误差mse和平均绝对误差mae。默认是mse
  • iterations:可选,整数,默认值10,最大值2147483647,最小值1,树的数量,数量越大,则模型越复杂,学习能力越强,更有可能过拟合,需要更多的计算资源
  • feature_fraction:可选,浮点数,默认值1,最大值1,最小值0,特征使用率:寻找最佳分割时要考虑的特征比率
  • max_depth:可选,整数,默认值30,最大值2147483647,最小值0,树的最大深度,限制每棵树的最大深度,数值大拟合能力强,数值小泛化能力强。设置为0则不限制
  • min_samples_per_leaf:可选,整数,默认值200,最大值2147483647,最小值1,每叶节点最小样本数:每个叶节点最少需要的样本数量,一般值越大,泛化性性越好
  • key_cols:可选,字符,默认值date,instrument,关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔
  • workers:可选,整数,默认值1,最大值2147483647,最小值-2147483648,并行作业数,同时使用多少个进程进行计算,默认是1,普通用户最多为2,会员可以使用更多资源
  • other_train_parameters:可选,代码,默认值{},其他训练参数,字典格式,例:{'criterion': 'mse'}

返回:

  • output_model:output_model,训练出来的模型
  • predictions:predictions,预测结果,如果predict_ds为None,predictions也为None