通过数据源进行基础特征抽取

# 通过数据源进行基础特征抽取

定义

M.use_datasource.v1(instruments,features,datasource_id,start_date,end_date)

基础特征(因子)抽取:读取基础数据字段,这里抽取的是基础特征,可以理解成将基本特征数据读取出来

参数:

  • instruments_list(列表|DataSource) – 证券代码列表。
  • features (列表|DataSource) – 特征列表。
  • datasource_id (str) - 表名。
  • start_date (str) – 开始日期,示例 2017-02-12,一般不需要指定,使用 证券代码列表 里的开始日期;默认值是。
  • end_date (str) – 结束日期,示例 2017-02-12,一般不需要指定,使用 证券代码列表 里的结束日期;默认值是。

返回:

  • .data: 基础特征数据

返回类型:

  • Outputs

示例代码:

m2 = M.input_features.v1(
    features="""
# #号开始的表示注释
close
high
shift(open,1)
mean(close, 10)
"""
)

m3 = M.instruments.v2(
    start_date='2018-01-01',
    end_date='2018-06-01',
    market='CN_STOCK_A',
    instrument_list='000002.SZA',
    max_count=0
)

m1 = M.use_datasource.v1(
    instruments=m3.data,
    features=m2.data,
    datasource_id='bar1d_CN_STOCK_A',
    start_date='',
    end_date=''
    )

m1.data.read_df().head()

运行结果:

[2018-09-11 20:40:18.324188] INFO: bigquant: input_features.v1 开始运行..
[2018-09-11 20:40:18.337733] INFO: bigquant: input_features.v1 运行完成[0.013525s].
[2018-09-11 20:40:18.340658] INFO: bigquant: instruments.v2 开始运行..
[2018-09-11 20:40:18.346134] INFO: bigquant: 命中缓存
[2018-09-11 20:40:18.348159] INFO: bigquant: instruments.v2 运行完成[0.00748s].
[2018-09-11 20:40:18.352060] INFO: bigquant: use_datasource.v1 开始运行..
[2018-09-11 20:40:18.768532] INFO: bigquant: use_datasource.v1 运行完成[0.416372s].
date    instrument    open    close    high
3259    2018-01-02    000002.SZA    4318.086914    4470.489746    4529.528809
4224    2018-01-03    000002.SZA    4462.251953    4438.910645    4637.996094
10213    2018-01-04    000002.SZA    4497.949707    4547.377930    4603.670898
10695    2018-01-05    000002.SZA    4528.155762    4772.549805    4926.326172
15642    2018-01-08    000002.SZA    4820.604980    4941.429199    5074.609863