我想使用 CNN 模型对图像进行分类,但我的数据集中的某些类的数据量很少。
我可以根据类中图像的数量应用数据增强吗?
例如,包含 10 张图像的类在增强后将变为 50,即图像数量增加 500%,包含 20 张图像的类将增加 250% 为 50 张图像,包含 30 张图像的类将增加增加 166% 为 50 张图像。
所以,我想根据类中的图像数量增加数据。
我想使用 CNN 模型对图像进行分类,但我的数据集中的某些类的数据量很少。
我可以根据类中图像的数量应用数据增强吗?
例如,包含 10 张图像的类在增强后将变为 50,即图像数量增加 500%,包含 20 张图像的类将增加 250% 为 50 张图像,包含 30 张图像的类将增加增加 166% 为 50 张图像。
所以,我想根据类中的图像数量增加数据。
尝试对输入数据进行欠采样或过采样,并额外使用数据增强。
我不会只对某些类使用数据扩充。也许这会给您的数据集带来偏差。
我会使用加权示例。因此,如果网络看到一个样本较少的类,则梯度会被放大。此外,您应该在一批中通过每个班级的至少一个示例(如果您的班级数量允许的话)。