天蝎座m2数据过滤之后再进行序列窗口滚动会出错吗?
由berg223创建,最终由berg223 被浏览 34 用户
问题
在研究天蝎座0.6策略时发现一个问题。
在进行序列窗口滚动之前进行了数据过滤,数据过滤后时间序列应该不再是连续的,这种情况下再进行时间窗口滚动得到的特征图片不就是错的吗? 如果是错的,正确做法应该怎么做呢
代码可以看 https://bigquant.com/wiki/doc/06-tianti-NO-celve-yuanma-VgHM3NV3md
举个例子详细说一下这个问题:
比如滚动窗口是3天, 假设本来应该用2018-01-01 到 2018-01-03 这三天的因子来生成 2018-01-03这一天的特征图片,但是由于在序列滚动窗口前一步存在数据过滤,2018-01-02这一天被过滤掉了,这个时间序列就不再连续了,序列滚动窗口模块在生成特征图片时用的时间序列就不是连续的,这样就有问题了
解答
目前序列窗口滚动这个模块确实没有做时序是否连续的判断。
我看了下天蝎座这个策略,确实会因为过滤条件的原因导致股票时序性不够连续。
另外,该模型当中,「序列窗口滚动」这个窗口是将特征做了展开的,相当于输出的维度是(window*num_feature, )而不是(window, num_features, )
所以,训练数据这么塞入到模型当中是否能够训练到一定的时序信息,这个就得看如何去理解1DCNN这个模型和传入的训练数据了