AI可视化的因子特征数据清洗
大部分的金工报告中第一步都是提取因子数据,随后就是对这些因子特征数据的清洗。以华泰证券的金工报告为例,数据清洗的标准流程大概包括:
清洗的目的是使得因子数据摆脱异常值、行业、市值和多重共线性的影响。
def bigquant_run(input_1, input_2, input_3):
#
更新时间:2024-06-11 03:29
更新时间:2024-05-20 02:34
更新时间:2024-05-20 02:09
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-15 08:18
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-15 06:18
https://bigquant.com/experimentshare/38f797c669544973a4b4f85fee6d6842
单任务执行
https://bigquant.com/experimentshare/ff82ae821cff43aa95bed62a48ea8345
\
更新时间:2023-10-09 06:16
在多因子选股中使用分析师预期数据时,最常用的方法是将预期数据与其他因子合成,或共同用于预测股票收益,这相当于因子间的并联处理。但股票的分析师预期数据存在很多缺失值,这会影响到正常使用。BL 模型则很适合于处理这类有较多缺失值的因子。
我们在本篇报告中研究了分析师预期数据的串联使用方法:即先构造不含分析师预期数据的传统多因子组合,然后在组合外部通过 BL 模型及分析师预期数据重新计算股票权重,两部分结合后形成新的股票组合。
本文的目的是进行方法上的对比,因此并没有对多因子组合做过多优化,仅按照
更新时间:2023-06-01 14:28
请问,数据的标准化、中性化、缺失值处理的先后顺序是什么?
哪些因子有必要做中性化处理呢?
问题1:一般的顺序为:去极值 → 缺失值处理 → 标准化 → 中性化。
问题:中性化起到一个提纯的作用,常见的为市值中性化和行业中性化。比如日成交额因子受市值的影响很大,市值大的通常成交额较大,无法准确估计出股票收益率到底是受到日成交额的影响更大还是市值,因此,先要对成交额因子提纯,排除市值的影响。
更新时间:2023-06-01 02:13
请教下大佬们,这里m45模块过滤数据以后当天没有满足的数据 然后到m27(序列窗口滚动)这里的时候因为数据空了会报错 这个地方能不能怎么处理
更新时间:2022-11-09 01:23
更新时间:2022-02-21 11:25