练习¶

提取计算log(volume_0)因子的历史序列值
按股票分组数据，每组数据分别向下缺失值填充
删除未填充的NaN值行
按日期截面对log(volume_0)做数据标准化

In [4]:

# 本代码由可视化策略环境自动生成 2021年10月14日21:32
# 本代码单元只能在可视化模式下编辑。您也可以拷贝代码，粘贴到新建的代码单元或者策略，然后修改。


m1 = M.instruments.v2(
    start_date='2015-01-01',
    end_date='2016-01-01',
    market='CN_STOCK_A',
    instrument_list='',
    max_count=0
)

m3 = M.input_features.v1(
    features="""# #号开始的表示注释
# 多个特征，每行一个，可以包含基础特征和衍生特征
log(volume_0)"""
)

m15 = M.general_feature_extractor.v7(
    instruments=m1.data,
    features=m3.data,
    start_date='',
    end_date='',
    before_start_days=0
)

m16 = M.derived_feature_extractor.v3(
    input_data=m15.data,
    features=m3.data,
    date_col='date',
    instrument_col='instrument',
    drop_na=False,
    remove_extra_columns=False
)

m11 = M.fill_nan.v1(
    input_1=m16.data,
    input_2=m3.data,
    group_key=['instrument'],
    method='向下填充'
)

m6 = M.dropnan.v1(
    input_data=m11.data
)

m5 = M.standardlize.v8(
    input_1=m6.data,
    input_2=m3.data,
    columns_input='[]'
)

[2021-10-14 21:32:22.939213] INFO: moduleinvoker: instruments.v2 开始运行..

[2021-10-14 21:32:22.949766] INFO: moduleinvoker: 命中缓存

[2021-10-14 21:32:22.951327] INFO: moduleinvoker: instruments.v2 运行完成[0.012127s].

[2021-10-14 21:32:22.955595] INFO: moduleinvoker: input_features.v1 开始运行..

[2021-10-14 21:32:22.961487] INFO: moduleinvoker: 命中缓存

[2021-10-14 21:32:22.963639] INFO: moduleinvoker: input_features.v1 运行完成[0.008044s].

[2021-10-14 21:32:22.981132] INFO: moduleinvoker: general_feature_extractor.v7 开始运行..

[2021-10-14 21:32:22.993144] INFO: moduleinvoker: 命中缓存

[2021-10-14 21:32:22.995178] INFO: moduleinvoker: general_feature_extractor.v7 运行完成[0.01406s].

[2021-10-14 21:32:23.002539] INFO: moduleinvoker: derived_feature_extractor.v3 开始运行..

[2021-10-14 21:32:23.008269] INFO: moduleinvoker: 命中缓存

[2021-10-14 21:32:23.010226] INFO: moduleinvoker: derived_feature_extractor.v3 运行完成[0.007676s].

[2021-10-14 21:32:23.021785] INFO: moduleinvoker: fill_nan.v1 开始运行..

[2021-10-14 21:32:23.028581] INFO: moduleinvoker: 命中缓存

[2021-10-14 21:32:23.030998] INFO: moduleinvoker: fill_nan.v1 运行完成[0.009218s].

[2021-10-14 21:32:23.041465] INFO: moduleinvoker: dropnan.v1 开始运行..

[2021-10-14 21:32:23.050890] INFO: moduleinvoker: 命中缓存

[2021-10-14 21:32:23.052300] INFO: moduleinvoker: dropnan.v1 运行完成[0.010835s].

[2021-10-14 21:32:23.058020] INFO: moduleinvoker: standardlize.v8 开始运行..

[2021-10-14 21:32:23.067361] INFO: moduleinvoker: 命中缓存

[2021-10-14 21:32:23.069618] INFO: moduleinvoker: standardlize.v8 运行完成[0.011583s].

In [5]:

'''查看缺失数据处理后的结果'''
m6.data.read_df().head()

Out[5]:

	date	instrument	volume_0	log(volume_0)
0	2015-01-05	000001.SZA	286043643	19.471655
1	2015-01-06	000001.SZA	216642140	19.193757
2	2015-01-07	000001.SZA	170012067	18.951380
3	2015-01-08	000001.SZA	140771421	18.762648
4	2015-01-09	000001.SZA	250850023	19.340366