我正在对图像(2 类)训练 CNN,并且我有一个不平衡的数据集(1:7 比率)。我试图通过执行离线图像增强来解决这个问题。我是否应该在验证集上也执行扩充,或者如果验证集仍然不平衡,是否可以?
当数据集不平衡时,是否也应该对验证集执行扩充?
数据挖掘
美国有线电视新闻网
图像分类
阶级失衡
数据增强
2022-02-25 09:38:28
2个回答
参考上一个问题,没有理由解决不平衡问题,除非您的模型无法正确地使用不平衡数据集进行学习。此外,1:7 并没有那么大的不平衡。
我想你对增强的想法是错误的。图像增强用于通过使用不同的操作(如旋转、切片、镜像等)在现有图像数据集中引入变化,以使模型更加健壮。但是,只要对整个数据集执行所有操作,对不平衡数据使用图像增强就会使结果数据保持不平衡。因此,如果您以上述方式看待它,那么仅在训练或训练和验证上执行增强的问题没有多大意义。
我建议您仅在您认为要训练的示例较少并且希望使模型更健壮但在整个数据集上进行时才选择图像增强。
如果您觉得在训练期间受苦或回忆较少,您也可以对少数族裔班级进行过度抽样。
要对少数类进行过采样,您可以仅对少数类执行图像增强。
其它你可能感兴趣的问题