CNN模型中基于类类型的数据增强

数据挖掘 深度学习 喀拉斯 张量流 计算机视觉 卷积神经网络
2022-02-25 11:57:31

我想使用 CNN 模型对图像进行分类,但我的数据集中的某些类的数据量很少。

我可以根据类中图像的数量应用数据增强吗?

例如,包含 10 张图像的类在增强后将变为 50,即图像数量增加 500%,包含 20 张图像的类将增加 250% 为 50 张图像,包含 30 张图像的类将增加增加 166% 为 50 张图像。

所以,我想根据类中的图像数量增加数据。

2个回答

尝试对输入数据进行欠采样或过采样,并额外使用数据增强。

我不会只对某些类使用数据扩充。也许这会给您的数据集带来偏差。

我会使用加权示例。因此,如果网络看到一个样本较少的类,则梯度会被放大。此外,您应该在一批中通过每个班级的至少一个示例(如果您的班级数量允许的话)。