特征预处理

# 特征预处理

# 标准化(V1)

本模块是对sklearn的封装,详细文档请参考: https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.Normalizer.html#sklearn.preprocessing.Normalizer

定义

M.preprocessing_normalizer.v1(norm)

参数:

  • feature_range_low:可选,整数,默认值0,最大值2147483647,最小值-2147483648,特征缩放下限,将特征缩放到执行范围之间
  • feature_range_high:可选,整数,默认值1,最大值2147483647,最小值-2147483648,特征缩放上限,将特征缩放到执行范围之间

返回:

  • output_model:output_model,训练出来的模型
  • transform_trainds:transform_trainds,转换后训练集
  • transform_predictds:transform_predictds,转换后预测集

# 特征缩放(V1)

本模块是对sklearn的封装,详细文档请参考: https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.MinMaxScaler.html#sklearn.preprocessing.MinMaxScaler

定义

M.preprocessing_min_max_scaler.v1(feature_range_low,feature_range_high)

参数:

  • feature_range_low:可选,整数,默认值0,最大值2147483647,最小值-2147483648,特征缩放下限,将特征缩放到执行范围之间
  • feature_range_high:可选,整数,默认值1,最大值2147483647,最小值-2147483648,特征缩放上限,将特征缩放到执行范围之间

返回:

  • output_model:output_model,训练出来的模型
  • transform_trainds:transform_trainds,转换后训练集
  • transform_predictds:transform_predictds,转换后预测集

# 叙述编码(V1)

本模块是对sklearn的封装,详细文档请参考: https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OrdinalEncoder.html#sklearn.preprocessing.OrdinalEncoder

定义

M.preprocessing_ordinal_encoder.v1()

参数:

返回:

  • output_model:output_model,训练出来的模型
  • transform_trainds:transform_trainds,转换后训练集
  • transform_predictds:transform_predictds,转换后预测集

# 主成分分析降维(V1)

本模块是对sklearn的封装,详细文档请参考: https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html#sklearn.decomposition.PCA

定义

M.decomposition_pca.v1(n_components,whiten,other_train_parameters)

参数:

  • n_components:可选,整数,默认值1,最大值2147483647,最小值1,主成分特征个数,希望PCA降维后的特征维度数目
  • whiten:必选,布尔,默认值False,白化,使得每个特征具有相同的方差
  • other_train_parameters:可选,代码,默认值{},其他训练参数,字典格式,例:{'criterion': 'mse'}

返回:

  • output_model:output_model,训练出来的模型
  • pca_features:pca_features,降维后的特征
  • transform_trainds:transform_trainds,降维后训练集,降维特征通过属性pca_features查看
  • transform_predictds:transform_predictds,降维后预测集,降维特征通过属性pca_features查看

# 最大绝对值归一化(V1)

本模块是对sklearn的封装,详细文档请参考: https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.MaxAbsScaler.html#sklearn.preprocessing.MaxAbsScaler

定义

M.preprocessing_max_abs_scaler.v1()

参数:

返回:

  • output_model:output_model,训练出来的模型
  • transform_trainds:transform_trainds,转换后训练集
  • transform_predictds:transform_predictds,转换后预测集

# RobustScaler标准化(V1)

本模块是对sklearn的封装,详细文档请参考: https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.RobustScaler.html#sklearn.preprocessing.RobustScaler

定义

M.preprocessing_robust_scaler.v1(with_centering,with_scaling,quantile_range_min,quantile_range_max)

参数:

  • with_centering:必选,布尔,默认值True,中心化
  • with_scaling:必选,布尔,默认值True,数据是否按分位数缩放
  • quantile_range_min:可选,浮点数,默认值25,最大值1.7976931348623157e+308,最小值0, 缩放分位数下限,介于0.0到100.0之间
  • quantile_range_max:可选,浮点数,默认值75,最大值100,最小值-1.7976931348623157e+308,缩放分位数上限,介于0.0到100.0之间

返回:

  • output_model:output_model,训练出来的模型
  • transform_trainds:transform_trainds,转换后训练集
  • transform_predictds:transform_predictds,转换后预测集

# StandardScaler标准化(V1)

本模块是对sklearn的封装,详细文档请参考: https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.StandardScaler.html#sklearn.preprocessing.StandardScaler

定义

M.preprocessing_standard_scaler.v1(with_mean,with_std)

参数:

  • with_mean:必选,布尔,默认值True,中心化
  • with_std:必选,布尔,默认值True,缩放到单位标准差

返回:

  • output_model:output_model,训练出来的模型
  • transform_trainds:transform_trainds,转换后训练集
  • transform_predictds:transform_predictds,转换后预测集