我想用 CNN 做 5 个类的分类,但是其中 4 个类只有 16 到 60 张图像,而最后一个有 1300 多张。我知道 16 或 60 张图像是不够的,所以我想用迁移学习、微调和数据增强。但是,我有几个问题。
由于数据增强只能用于训练数据,因此我将只有很少的 4 个类别的图像用于验证集,这会不会有问题?
是否需要将其拆分为培训/验证/测试,或者培训/验证是否足够?
另一个问题是数据不平衡:由于每个类别中的图像数量之间存在如此差异,过采样或欠采样会是一个好的解决方案吗?
对于迁移学习和微调,我应该冻结所有卷积层还是只训练一个 FC 层?