描述数据清洗过程

数据挖掘 数据清理
2022-02-26 16:50:11

术语“数据清洗”用于描述异常值检查、日期解析、对结构化数据集(在数据集中组织数据值)的缺失值插补以促进分析。

后者通常被称为“数据整理”,但前者呢?我见过被称为“软处理”的异常值检查、日期解析和缺失值插补,但是我想知道这是否是一个常用术语。

如果我将数据清理的一个组件描述为“软处理”,那么假设知识渊博的人会知道我指的是异常值检查、日期解析和缺失值插补是否合理?

在数据科学领域,是否有一个普遍接受的短语或术语涵盖异常值检查、日期解析和缺失值插补

1个回答

如果您不修改任何内容,则可以将其称为验证如果你是,你可以称之为preprocessing