M.general_feature_extractor¶
定义¶
-
M.general_feature_extractor.
v6
(self, instruments, features, start_date='', end_date='', before_start_days=0)¶ 基础特征(因子)抽取:读取基础数据字段,这里抽取的是基础特征,例如,对于特征 close_1/close_0,这里会读取出 close_0,close_1
参数: - instruments (列表|DataSource) – 证券代码列表。
- features (列表|DataSource) – 特征列表。
- start_date (str) – 开始日期,示例 2017-02-12,一般不需要指定,使用 证券代码列表 里的开始日期;默认值是。
- end_date (str) – 结束日期,示例 2017-02-12,一般不需要指定,使用 证券代码列表 里的结束日期;默认值是。
- before_start_days (float) – 向前取数据天数,比如,用户通过表达式计算的衍生特征,可能需要用到开始日期之前的数据,可以通过设置此值实现,则数据将从 开始日期-向前取数据天数 开始取。考虑到节假日等,建议将此值得大一些;默认值是0。
返回: - .data: 基础特征数据
返回类型: Outputs
示例代码¶
查看模块可用版本¶
In [6]:
M.general_feature_extractor.m_get_version
Out[6]:
<bound method BigQuantModule.m_get_version of 模块:general_feature_extractor
可用版本(推荐使用最新版本):v6, v5>
抽取指定特征¶
In [7]:
m = M.general_feature_extractor.v6(
instruments=['000001.SZA', '600519.SHA'],
start_date='2017-01-01', end_date='2017-02-01',
features=['close_5/close_0', 'close_10/close_0', 'close_20/close_0'])
[2017-11-14 15:20:21.017833] INFO: bigquant: general_feature_extractor.v6 开始运行..
[2017-11-14 15:20:21.053995] INFO: bigquant: 命中缓存
[2017-11-14 15:20:21.055203] INFO: bigquant: general_feature_extractor.v6 运行完成[0.037365s].
In [8]:
m.data.read_df().head()
Out[8]:
close_0 | close_10 | close_20 | close_5 | date | instrument | |
---|---|---|---|---|---|---|
0 | 959.585571 | 963.775940 | 991.013062 | 955.395264 | 2017-01-03 | 000001.SZA |
1 | 2343.583984 | 2283.341309 | 2213.081543 | 2272.973877 | 2017-01-03 | 600519.SHA |
2 | 959.585571 | 954.347656 | 994.155823 | 951.204956 | 2017-01-04 | 000001.SZA |
3 | 2465.120361 | 2286.983887 | 2286.563721 | 2284.742432 | 2017-01-04 | 600519.SHA |
4 | 960.633179 | 959.585571 | 993.108215 | 949.109802 | 2017-01-05 | 000001.SZA |
为给定模型抽取特征数据¶
In [ ]:
m = M.general_feature_extractor.v6(
instruments=['000001.SZA', '600519.SHA'],
start_date='2017-01-01', end_date='2017-02-01',
model_id=m5.model_id) # m5 = M.stock_ranker_train.v5(), 训练出的模型id