使用 smote 和 OSS 解决多类不平衡分类

数据挖掘 多类分类 阶级失衡 打击
2022-03-14 02:03:45

我正在尝试解决多类不平衡分类问题。为此,我使用 SMOTE 进行过采样,使用 OSS 进行欠采样。但是我有一个疑问,因为我正在研究多类,所以我必须将其转换为二进制分类。所以我们可以使用 OVA/OAA 对其进行转换。那么如何在同一个数据集上使用 OVA/OAA 同时进行欠采样和过采样呢?

2个回答

如果您将问题转换为二进制分类任务,则无需担心与重采样技术有任何冲突。然后,您可以imblearn.combine在一个算法中使用结合了过采样和欠采样的 。有可用的课程,但我发现SMOTEENN可以产生更好的结果。斯莫廷

我不确定为什么需要将分类任务转换为二进制子任务。使用 Python 中的 SMOTE/SMOTEENN 库,您可以在一行代码中对所有类进行过采样/欠采样。此外,如果您的特征集中有分类特征,您可能还需要查看 SMOTE-NC 方法,因为 SMOTE 和 SMOTEENN 纯粹基于距离,并且低估了分类特征的作用和价值。