问答交流

标准化、中性化、缺失值处理的先后顺序

由powertaurus创建,最终由powertaurus 被浏览 138 用户

问题

请问,数据的标准化、中性化、缺失值处理的先后顺序是什么?

哪些因子有必要做中性化处理呢?

解答

问题1:一般的顺序为:去极值 → 缺失值处理 → 标准化 → 中性化。

问题:中性化起到一个提纯的作用,常见的为市值中性化和行业中性化。比如日成交额因子受市值的影响很大,市值大的通常成交额较大,无法准确估计出股票收益率到底是受到日成交额的影响更大还是市值,因此,先要对成交额因子提纯,排除市值的影响。

标签

缺失值处理
评论
  • 问题1:一般的顺序为:去极值 → 缺失值处理 → 标准化 → 中性化。 问题:中性化起到一个提纯的作用,常见的为市值中性化和行业中性化。比如日成交额因子受市值的影响很大,市值大的通常成交额较大,无法准确估计出股票收益率到底是受到日成交额的影响更大还是市值,因此,先要对成交额因子提纯,排除市值的影响。
{link}