CNN 的一种热编码中的类不平衡

数据挖掘 分类 阶级失衡
2022-02-23 02:06:23

我正在为音频分类的 MFCC 功能构建 2D 卷积神经网络。

我面临的问题是它们之间有两个类和巨大的不平衡。一类有 17687 个样本,而另一类有 67737 个样本。我已经完成了一次热编码,所以我有两个 CNN 输出作为 [1,0] 和 [0,1]。

从我的研究看来,在 model.fit 中添加 class_weights 似乎只适用于二进制分类问题。有什么方法可以为一个热编码结果分配权重?

1个回答

您可能需要考虑使用 f1-score 等指标来衡量您的模型的表现。

请注意,如果在现实生活中,不平衡具有相似的性质,那么您的模型无论如何都必须考虑它。