如何在不平衡的图像数据集上训练卷积神经网络?
我的数据集有大约 400 个类,并且这些类有不同数量的图像。
如何在不平衡的图像数据集上训练卷积神经网络?
我的数据集有大约 400 个类,并且这些类有不同数量的图像。
通过过采样。训练 CNN 时,通常使用小批量梯度下降法。小批量方法包括随机获取一些图像,并通过在这些图像上反向传播模型的损失来对这些图像执行梯度步骤。这种随机选择不需要在所有图像上都是统一的。相反,您可以使具有少量元素的类中的图像比其他图像更有可能出现(对它们进行过采样)。有了这个,您不仅可以帮助 CNN 了解最流行的课程。
另外,如果某些类别的图像数量很少,建议进行图像增强,从而生成更多图像以避免过度拟合这些类别。