我正在使用称为 YOLO 的单次检测器进行交通标志检测的学士论文。这些单次检测器可以对图像中的物体进行检测,因此它们具有特定的训练方式,即。对完整图像进行训练。这对我来说是个很大的问题,因为具有完整交通标志图像的最大真实数据集是比利时的一个,它有 210 个类别的 9000 张图像,不幸的是,这不足以训练好的检测器。
为了克服这个问题,我创建了DatasetGenerator,它在生成合成数据集方面做得很好,你可以在results directory中看到。
最近我遇到了可以(除其他外)生成或扩展现有数据集的 GAN,我想使用这些网络与我的数据集生成器进行比较。我已经成功地尝试了对 GAN 的介绍。
问题是它是无监督学习,所以没有注释。这意味着它能够扩展我的交通标志数据集,但生成的数据集根本不会被注释,这是个问题。
所以我的问题是:有什么方法可以使用 GAN 来扩展我的完整交通标志图像数据集,并带有交通标志类别和位置的注释?其实班级并不重要,因为我可以为每个班级单独做,但重要的是交通标志在生成图像中的位置。