我正在处理分类任务。该数据集是一个关于机器学习的 UCI 数据集,包含 200 个观察值和 2 个类。
我的模型的一部分包括以下预处理步骤:
- 删除缺失值
- 在 0 和 1 之间标准化
- 去除异常值
- 平滑
- 从数据中去除趋势
- SMOTE
我想使用聚类方法来删除嘈杂的数据点。问题是,这应该发生在哪一步?
我正在处理分类任务。该数据集是一个关于机器学习的 UCI 数据集,包含 200 个观察值和 2 个类。
我的模型的一部分包括以下预处理步骤:
我想使用聚类方法来删除嘈杂的数据点。问题是,这应该发生在哪一步?
查看您的不同步骤,重要的是检查哪个步骤会受到异常值的影响。
因此,直观地说,我会在一开始或在第 1 步之后执行您的噪声消除。
最终,您应该看到什么更适合您的任务。也许删除异常值并没有您期望的那么大。与您的预处理相同。随意尝试!