测试文档


(XiaoyuDu) #1

1) 数据接入

该模块可根据输入的文件名和文件后缀(支持CSV Excel)读取数据,读取418行test.csv数据耗时0.0232秒,读取891行train.csv数据耗时0.024秒

右键点击查看结果就可以预览数据,展示速度快,并可以自动给出数据类型,缺失数并画图,如下图所示:
image

2)

2.1)

能够展示并展示数据分布的统计指标:
相关系数指标展示效果如图:
image

2.2)

平台存在大量简洁的数据过滤,处理,清洗模块,并支持自定义

比如我们很方便就可以通过过滤表达式:筛选出幸存的年轻男性(通过值域判断)

Survived ==1 and Sex ==‘male’ and Age <30 and Age >25,

我们可以很方便通过自定义模块的方式实现各种筛选功能,比如我们挑选出性别,年龄和性别三列
image

我们也可以通过自定义模块进行归一化,如图我们输入需要归一化的参数:年龄和票价
image
如下图所示输出的结果就对年龄和票价部分进行了缺失值处理,归一化和极值处理: