了解 Imagenet 训练

数据挖掘 张量流 图像分类 成立之初
2022-02-12 08:57:53

我正在尝试使用 Tensorflow 的初始模型开始训练 Imagenet 分类训练。我有点困惑,因为我不确定如何完全训练模型。

无论我走到哪里,每个人似乎都在使用 1000 班培训清单。然而,在挖掘 tensorflows 初始模型文件时,我发现了一个包含 21000 多个类的标签列表。

所以我有点困惑,我应该使用每个人似乎都在使用的 1000 个课程进行训练,还是应该使用 21000 个课程进行训练。我有完整的 imagenet 数据,我检查了我下载的图像,几乎所有 21000 个类都在那里(只缺少 200 个类)。

我真的很想针对完整的 imagenet 数据集进行训练,因为这应该会提供更高的准确性,但我不确定会出现什么问题,或者如何正确准备数据,以及有多少步骤适合。

1个回答

1000 个类的问题是 ILSVRC2012 挑战,它使用“仅”1000 个类的完整图像网络的子集。这样做的好处是它是固定的,而 imagenet 本身总是在扩展,并且可以添加新的类和示例。

在完整的 ImageNet 集上进行训练是一项非常漫长的任务,需要很长时间或很长时间以及大量的计算能力(谈论数十个 GPU)。尽管时间不短,但训练 ILSVRC2012 可以在一天到几天内完成,具体取决于您的硬件资源和正在训练的模型的复杂性。