关于默认可视化策略, 基础特征的"向前取数据天数"的微妙问题


(chaoskey) #1

关于默认可视化策略, 基础特征的"向前取数据天数"的微妙问题

改进前 对 跨4日的衍生因子. 取120 和 240相差很大.
改进后, 对 跨4日的衍生因子. 取120 和 240相差不大.

单因子可视化策略改进前

https://i.bigquant.com/user/chaoskey/lab/share/%E5%8D%95%E5%9B%A0%E5%AD%90%E6%B5%8B%E8%AF%95%2F%E5%8D%95%E5%9B%A0%E5%AD%90%E5%8F%AF%E8%A7%86%E5%8C%96%E7%AD%96%E7%95%A5%E6%94%B9%E8%BF%9B%E5%89%8D.ipynb

单因子可视化策略改进后

https://i.bigquant.com/user/chaoskey/lab/share/%E5%8D%95%E5%9B%A0%E5%AD%90%E6%B5%8B%E8%AF%95%2F%E5%8D%95%E5%9B%A0%E5%AD%90%E5%8F%AF%E8%A7%86%E5%8C%96%E7%AD%96%E7%95%A5%E6%94%B9%E8%BF%9B%E5%90%8E.ipynb


(iQuant) #2

有个地方比较模糊,你三种情形下,训练集的 基础特征列表的“向前取数据天数”是一样的吗?如果这里不一样的话,表明训练集不一样,训练出来的模型不一样,回测结果有差异就是正常情形。


(chaoskey) #3

第一种情况 和 第二种情况有差异 属于正常. 但第二种和第三种情况的差异很大属于不应该.


(chaoskey) #4

并且经过我的改进后, 保证了第二种和第三种情况的差异很小.


(chaoskey) #5

无论 训练集的 基础特征列表的“向前取数据天数”是否一样,

第二种和第三种情况的差异很大属于不应该相差很大.


(chaoskey) #6

就好比: 计算 mean(x, 20) 无论我多获取120天的数据, 还是 多获取240天的数据, 计算mean(x, 20)的结果都应该是一样.