历史文档

高频特征抽取-分钟到日频

由qxiao创建,最终由qxiao 被浏览 701 用户

使用场景

高频分钟数据合成日频因子。

输入端

  • 代码列表:代码列表,必选。
  • 特征列表:特征列表,必选
  • 表达式引擎自定义函数:自定函数,可选

输入参数

  • 开始日期:开始日期,必填。
  • 结束日期:结束日期,必填。
  • 向前取数据天数:默认为90天,向前取数据天数,
    • 比如,用户通过表达式计算的衍生特征,可能需要用到开始日期之前的数据,可以通过设置此值实现,则数据将从开始日期-向前取数据天数 开始取。考虑到节假日等,建议将此值得大一些。
  • 并行计算数量:并行数量越多可以使运行速度提升,同时也要考虑计算资源问题。
  • 并行模式:可选集群,单机,测试。
    • 测试:适合做一些因子调试和测试,只会抽取三只股票进行测试。
    • 集群:适合当完成了因子调试,进行实打实的计算,会在整个集群新起POD参与计算
    • 单机:只使用当前POD计算
  • 分钟数据源:选取分钟数据源表id。股票(bar1m_CN_STOCK_A)/期货(bar1m_CN_FUTURE

输出端

  • 基础特征数据:数据源。

    运行结果

    • 可以通过模块id.data.read()来查看模块中合成后的数据。


    {w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}

模块详讲

模块支持二次抽取因子

当利用高频特征抽取模块将分钟因子抽取为日频因子后可以继续对日频因子进行加过计算

例如:继续拖入特征列表模块进行特征提取

{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}也支持利用衍生特征抽取模块实现自定义表达式:

{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}模块案例

https://bigquant.com/experimentshare/fa88404896694875b4be43d5aeeda31c

\

评论
  • 输入特征列表里的bar1m_000905_HIX__close这个因子是啥?数据平台好像没有这个因子
  • 报错啊 ![{w:100}](/wiki/api/attachments.redirect?id=1c8477c7-35d3-499f-ace0-9b9bd8ea9f8e)
  • 麻烦看一下BUG
  • 那是数据表里的列名,直接获得数据表里的列数据了
  • 搞定没有,我也是一样报错啊