在深度神经网络的大规模图像识别问题中,有哪些可能的方法来处理类不平衡?

数据挖掘 分类 阶级失衡 深度学习 物体识别
2022-03-04 20:09:39

我有 22 类对象,但它们的分布非常倾斜,其中最大类有 100.000 个图像,最小类有 1600 个图像。在那种情况下,我想听听这个平衡问题的一些可能的解决方案。

到目前为止,我已经尝试过以下方法;

  1. 通过复制实例将较低类中的实例数乘以最大类,也可能添加一些噪声。

  2. 在下一个 epoch 的给定 minibatch 中改变关于类分布的学习。(没有实施,但在我看来)

你有什么建议?

1个回答

您还可以修改成本函数,以便较小类中的实例具有更大的权重。与您的选项 1 相比,这使得训练对计算的要求更低。