问答交流

关于序列窗口滚动

由svnquant创建,最终由small_q 被浏览 41 用户

问题

最近一直在研究咱们的策略开发平台,里面有一个很重要的模块——序列窗口滚动。这个模块也是开发深度学习策略的必备模块。但是一直对这个模块的功能有些疑问:

  1. 这个窗口滚动是否和卷积的滑动窗口是一个概念?用一个window_size大小的感受野去框学习数据,从而降低参数量级,实现某种意义上的特征表达?
  2. 在计算过程中,会强制把超过裁剪值的数据变成设定值,那是否意味着这个特征是失效的?
  3. 学习数据中的特征项的排列顺序是手工指定的,而这个滚动窗口又是基于这个顺序进行计算,是不是意味着这个指标的排列顺序会很大程度影响结果?

以上,请大神指教~

感谢~!

解答

  1. 对,可以这样理解。例如你要用过去10天的因子数据来训练,就可以用序列滚动窗口来组装过去10天的因子数据作为一条样本。
  2. 如果特征值超过某个范围,认为是不合理的无效值,可以去掉。
  3. 股票预测中样本是按照时间来排序的,某个特征放在第一个还是第二个位置个人认为不是特别的重要。

\

标签

特征提取
评论
  • 1、对,可以这样理解。例如你要用过去10天的因子数据来训练,就可以用序列滚动窗口来组装过去10天的因子数据作为一条样本。 2、如果特征值超过某个范围,认为是不合理的无效值,可以去掉。 3、股票预测中样本是按照时间来排序的,某个特征放在第一个还是第二个位置个人认为不是特别的重要。
  • 感谢回复\~! \
  • CNN算法 对特征的顺序有要求的。
  • 是,我也是这么理解的,所以我觉得特征的顺序在这里起到了很神奇的作用。