我想使用 Keras 和由 50 个类组成的数据集执行图像分类。目前,我每个类只有 7 张图像,我需要执行数据增强以训练模型并获得可接受的准确度值。
我正在使用kerasImageDataGenerator的课程,推荐用于动态图像增强(在训练期间)。由于分类表现不佳,我想知道是否有必要执行离线增强,即在训练之前扩大数据集,因为老实说,我认为 7 远不是每类图像的合理数量。
执行这两种类型的增强(在训练之前和训练期间)是一种常见的做法吗?我计划使用一些 3rd 方软件或工具,如 imgaug,首先扩大数据集并将增强后的图像保存到磁盘,然后才使用类执行实时增强ImageDataGenerator。
总之,流程将与此类似:
- 图像预处理和离线数据增强 => 放大原始数据集
- 实时增强训练 => 加载数据集并使用 ImageDataGenerator
你怎么认为?
谢谢你。