决策树—分类

# 决策树-分类

本模块是对sklearn的封装,详细文档请参考: https://scikit-learn.org/0.20/modules/generated/sklearn.tree.DecisionTreeClassifier.html#sklearn.tree.DecisionTreeClassifier

定义

M.decision_tree_classifier.v1(criterion,feature_fraction,max_depth,min_samples_per_leaf,key_cols,other_train_parameters)

参数:

  • criterion:必选,枚举,默认值gini,可选值['gini','entropy'],决定分割的标准,支持基尼不纯度gini和熵不纯度entropy,默认是gini
  • feature_fraction:可选,浮点数,默认值1,最大值1,最小值0,特征使用率:寻找最佳分割时要考虑的特征比率
  • max_depth:可选,整数,默认值30,最大值2147483647,最小值0,树的最大深度,限制每棵树的最大深度,数值大拟合能力强,数值小泛化能力强。设置为0则不限制
  • min_samples_per_leaf:可选,整数,默认值200,最大值2147483647,最小值1,每叶节点最小样本数:每个叶节点最少需要的样本数量,一般值越大,泛化性性越好
  • key_cols:可选,字符,默认值date,instrument,关键列,关键列的数据会复制到预测结果里,多个列用英文逗号分隔
  • other_train_parameters:可选,代码,默认值{},其他训练参数,字典格式,例:{'criterion': 'mse'}

返回:

  • output_model:output_model,训练出来的模型
  • predictions:predictions,预测结果,如果predict_ds为None,predictions也为None