问答交流

天蝎座m2数据过滤之后再进行序列窗口滚动会出错吗?

由berg223创建,最终由berg223 被浏览 34 用户

问题

在研究天蝎座0.6策略时发现一个问题。

在进行序列窗口滚动之前进行了数据过滤,数据过滤后时间序列应该不再是连续的,这种情况下再进行时间窗口滚动得到的特征图片不就是错的吗? 如果是错的,正确做法应该怎么做呢

代码可以看 https://bigquant.com/wiki/doc/06-tianti-NO-celve-yuanma-VgHM3NV3md

举个例子详细说一下这个问题:

比如滚动窗口是3天, 假设本来应该用2018-01-01 到 2018-01-03 这三天的因子来生成 2018-01-03这一天的特征图片,但是由于在序列滚动窗口前一步存在数据过滤,2018-01-02这一天被过滤掉了,这个时间序列就不再连续了,序列滚动窗口模块在生成特征图片时用的时间序列就不是连续的,这样就有问题了

解答

目前序列窗口滚动这个模块确实没有做时序是否连续的判断。

我看了下天蝎座这个策略,确实会因为过滤条件的原因导致股票时序性不够连续。

另外,该模型当中,「序列窗口滚动」这个窗口是将特征做了展开的,相当于输出的维度是(window*num_feature, )而不是(window, num_features, )

所以,训练数据这么塞入到模型当中是否能够训练到一定的时序信息,这个就得看如何去理解1DCNN这个模型和传入的训练数据了

评论
  • 没明白你意思呢,时序数据不再是连续的是为什么呢?序列滚动窗口是根据每一个标的进行时序的窗口滚动的。可以再说的详细一些呢,或者有相关代码可以分享出来一起看看
  • 代码可以看 举个例子详细说一下这个问题: 比如滚动窗口是3天, 假设本来应该用2018-01-01 到 2018-01-03 这三天的因子来生成 2018-01-03这一天的特征图片,但是由于在序列滚动窗口前一步存在数据过滤,2018-01-02这一天被过滤掉了,这个时间序列就不再连续了,序列滚动窗口模块在生成特征图片时用的时间序列就不是连续的,这样就有问题了
  • 你理解是正确的,目前序列窗口滚动这个模块确实没有做时序是否连续的判断。 我看了下天蝎座这个策略,确实会因为过滤条件的原因导致股票时序性不够连续。 另外,该模型当中,「序列窗口滚动」这个窗口是将特征做了展开的,相当于输出的维度是(window\*num_feature, )而不是(window, num_features, ) 所以,训练数据这么塞入到模型当中是否能狗训练到一定的时序信息,这个就得看如何去理解1DCNN这个模型和传入的训练数据了 \
{link}