自动标注-任意数据

# 自动标注-任意数据

利用表达式引擎通过任意数据源输出的DataFrame所含列自动计算标注,作为高级数据标注模块的补充。
定义

M.auto_labeler_on_datasource .v1(input_data=None, label_expr=str,drop_na_label=True,cast_label_int=True,date_col='date',instrument_col='instrument',user_functions={})

参数

  • input_data(DataSource)—任意数据源的DataSource
  • label_expr(str)—要计算的标注表达式,表达式所用的因子必须是input_data中含有的列
  • drop_na_label(Bool)— 删除无标注数据,是否删除没有标注的数据;默认值是True
  • cast_label_int(Bool)— 将标注转换为整数,一般用于分类学习;默认值是True。
  • user_functions—(字典)—自定义表达式函数,字典格式,例:{‘user_rank’:user_rank},字典的key是方法名称,字符串类型,字典的value是方法的引用,参考表达式引擎;默认值是{}

返回:

标注数据

返回类型

OutPuts