使用本例子介绍如何进行自定义因子构建¶

本例子希望：¶

构建一个收益率因子
该因子按日期进行分组，分成3组

In [17]:

# 本代码由可视化策略环境自动生成 2021年12月23日 22:16
# 本代码单元只能在可视化模式下编辑。您也可以拷贝代码，粘贴到新建的代码单元或者策略，然后修改。


def _ret(df, factor , N):
    # 单支票求收益率
    df['ret'] = factor / factor.shift(N) -1  # 这里的factor 是一个pandas的Series对象
    return df 
    
def get_ret(df, factor, N):
    # 全市场求收益率, 按标的进行分组
    ret_df = df.groupby('instrument').apply(_ret, factor=factor, N=N).reset_index()
    return ret_df['ret'] # 求一个表达式的数值，应该返回一个Series对象

def _cut(df, factor, Bins):
    # 单个交易日横截面进行cut
    df['label'] = pd.cut(factor.rank(pct=True), bins=Bins, labels=False) / (Bins-1)
    return df

def cut(df, factor, Bins=3):
    # 全部交易日进行cut, 按date进行分组
    label_df = df.groupby('date').apply(_cut, factor=factor,  Bins=Bins).reset_index() 
    return label_df['label'] #  求一个表达式的数值，应该返回一个Series对象


# 因为这俩表达式是我们新自定义的表达式，因此需要声明，以便在输入特征列表可使用
m16_user_functions_bigquant_run = {
    'cut':cut, 
    'get_ret':get_ret,
}

m1 = M.instruments.v2(
    start_date='2021-10-01',
    end_date='2021-12-01',
    market='CN_STOCK_A',
    instrument_list='',
    max_count=0
)

m3 = M.input_features.v1(
    features="""get_ret(close_0, 15)
cut(get_ret(close_0, 15), 3)
"""
)

m15 = M.general_feature_extractor.v7(
    instruments=m1.data,
    features=m3.data,
    start_date='',
    end_date='',
    before_start_days=0
)

m16 = M.derived_feature_extractor.v3(
    input_data=m15.data,
    features=m3.data,
    date_col='date',
    instrument_col='instrument',
    drop_na=False,
    remove_extra_columns=False,
    user_functions=m16_user_functions_bigquant_run
)

[2021-12-23 22:14:08.597977] INFO: moduleinvoker: instruments.v2 开始运行..

[2021-12-23 22:14:08.702776] INFO: moduleinvoker: instruments.v2 运行完成[0.104805s].

[2021-12-23 22:14:08.707913] INFO: moduleinvoker: input_features.v1 开始运行..

[2021-12-23 22:14:08.722589] INFO: moduleinvoker: 命中缓存

[2021-12-23 22:14:08.726591] INFO: moduleinvoker: input_features.v1 运行完成[0.018676s].

[2021-12-23 22:14:08.883826] INFO: moduleinvoker: general_feature_extractor.v7 开始运行..

[2021-12-23 22:14:50.355414] INFO: 基础特征抽取: 年份 2021, 特征行数=177232

[2021-12-23 22:14:50.468746] INFO: 基础特征抽取: 总行数: 177232

[2021-12-23 22:14:50.475067] INFO: moduleinvoker: general_feature_extractor.v7 运行完成[41.591242s].

[2021-12-23 22:14:50.487708] INFO: moduleinvoker: derived_feature_extractor.v3 开始运行..

[2021-12-23 22:15:04.236769] INFO: derived_feature_extractor: 提取完成 get_ret(close_0, 15), 13.356s

[2021-12-23 22:15:21.544636] INFO: derived_feature_extractor: 提取完成 cut(get_ret(close_0, 15), 3), 17.306s

[2021-12-23 22:15:22.157552] INFO: derived_feature_extractor: /y_2021, 177232

[2021-12-23 22:15:22.277948] INFO: moduleinvoker: derived_feature_extractor.v3 运行完成[31.790232s].