我有 22 类对象,但它们的分布非常倾斜,其中最大类有 100.000 个图像,最小类有 1600 个图像。在那种情况下,我想听听这个平衡问题的一些可能的解决方案。
到目前为止,我已经尝试过以下方法;
通过复制实例将较低类中的实例数乘以最大类,也可能添加一些噪声。
在下一个 epoch 的给定 minibatch 中改变关于类分布的学习。(没有实施,但在我看来)
你有什么建议?
我有 22 类对象,但它们的分布非常倾斜,其中最大类有 100.000 个图像,最小类有 1600 个图像。在那种情况下,我想听听这个平衡问题的一些可能的解决方案。
到目前为止,我已经尝试过以下方法;
通过复制实例将较低类中的实例数乘以最大类,也可能添加一些噪声。
在下一个 epoch 的给定 minibatch 中改变关于类分布的学习。(没有实施,但在我看来)
你有什么建议?
您还可以修改成本函数,以便较小类中的实例具有更大的权重。与您的选项 1 相比,这使得训练对计算的要求更低。