我正在训练一个网络来对动物园动物进行图像分类。
我是一名软件工程师,而不是 ML 专家,所以我一直在重新训练 Google 的 Inception 模型,最新的模型是使用 Google AutoML Vision 进行训练的。
该网络表现得非常好,但我不希望任何标签的动物图像出现问题。基本上我希望这些动物的图像被归类为未知数或获得低分。
我确实有一些我不想要标签的动物图像,我尝试将它们全部放入一个“无”标签中,以及我收集的没有任何动物的动物栖息地的图像。但这并没有真正产生任何好的结果。该网络为标记的动物执行,但最终也将这些标签中的一个分配给其他动物。通常也有很高的分数。
我有 14 个标签和 10.000 张图像。我还应该提到,与实际标签相比,“无”标签最终会包含很多图像。这些图像不包括在 10.000 中。
有什么技巧可以用这个来达到更好的效果吗?我应该为“无”类别中的图像创建多个标签吗?