数据预处理疑问?


(1899) #1

请问为什么在非可视化策略里有数据预处理这个步骤,在可视化策略里却只是缺失数据处理?


(iQuant) #2

你好,感谢这么细心的用户。

之前的代码模式下,通过m2 = M.general_feature_extractor.v5()抽取出来的数据是原始的特征数据,这样的特征数据一般是保留到小数点后多位,不是整型数据(int),而stockranker算法默认接受的数据就必须是整型数据,因此需要通过M.transform.v2进行数据转换。具体转换的方式可以参考:
image

而在可视化模式下,stockranker算法可以接受非整型数据,因此可以不用进行数据转换,去下缺失值即可。

希望对你有帮助!


(1899) #4

那也就是说,可视化下抽取的原始特征数据可以直接带入模型去训练,而不需要标准化和去极值?可是这是不是有点不妥呢


(iQuant) #5

标准化和去极值等数据处理需要结合具体的算法,stockranker这个算法可以不需要这样的数据处理。但其他的算法建议进行标准化和去极值,更为妥当。