图像分类中的“其他”类

数据挖掘 机器学习 神经网络 深度学习 图像分类 训练
2021-10-08 19:44:00

在 MNIST 数据集中,您有 10 个定义的类,每个数字一个。但是您没有“非数字”类。似乎大多数图像分类数据集都是相同的。但是在商业环境中,对于生产模型,您肯定会得到与任何定义的类都不对应的无效图像。

因此,假设您要创建一个手写数字图像分类模型以用于实际项目。如果您没有“非数字”类别,那么如果有人提交了字母“M”的图片,那么它将被错误地归类为 10 位数字类别之一。

所以,在这个例子中,你是否应该定义一个“非数字”类并在一组图像上训练模型,模型可能会收到与手写数字无关的图像,这样无效图像就会被正确分类为“不是数字”?

1个回答

你可以拥有它,但我为你的情况推荐其他东西。假设您有 10 类相互排斥的数字。因此,您的输出向量将始终进行热编码。在一个简单的情况下,您的输出向量应该包含每个类的十个条目。要使您的模型区分那些是数字的输入和那些不是数字的输入,请执行以下操作:

将输出大小增加到十一个。提供包含十一个条目标签的数据集。第一个条目对应于数字的存在。如果是数字,则第一个条目应该是一个,接下来的 10 个条目应该根据数字的值激活。因此,您的标签不会被一次性编码。如果输入不是数字,则输出的第一个条目应为零,而其他条目则无关紧要。