自适应提升树—分类

# 自适应提升树-分类

本模块是对sklearn的封装,详细文档请参考: https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.AdaBoostClassifier.html#sklearn.ensemble.AdaBoostClassifier

其他参数说明: base_estimator为弱学习器类型,默认None,为DecisionTreeClassifier(max_depth=1)

定义

M.adaboost_classifier.v1(n_estimators,algorithm,learning_rate,key_cols,other_train_parameters)

参数:

  • n_estimators:可选,整数,默认值50,最大值2147483647,最小值1,弱学习器个数,或者弱学习器最大迭代次数,太小容易欠拟合,太大容易过拟合,默认为50
  • algorithm:必选,枚举,默认值SAMME.R,可选值['SAMME.R','SAMME'],分类算法,SAMME.R使用了对样本集分类的预测概率大小来作为弱学习器权重,迭代一般比SAMME快
  • learning_rate:可选,浮点数,默认值1,最大值1,最小值0,学习率,该值缩减每个弱学习器的权重,通常较小的系数需要更多的迭代,因此n_estimators和learning_rate要一起调参
  • key_cols:可选,字符,默认值date,instrument,关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔
  • other_train_parameters:可选,代码,默认值{'base_estimator': None},其他训练参数,字典格式,例:{'criterion': 'mse'}

返回:

  • output_model:output_model,训练出来的模型
  • predictions:predictions,预测结果,如果predict_ds为None,predictions也为None