在 MNIST 数据集中,您有 10 个定义的类,每个数字一个。但是您没有“非数字”类。似乎大多数图像分类数据集都是相同的。但是在商业环境中,对于生产模型,您肯定会得到与任何定义的类都不对应的无效图像。
因此,假设您要创建一个手写数字图像分类模型以用于实际项目。如果您没有“非数字”类别,那么如果有人提交了字母“M”的图片,那么它将被错误地归类为 10 位数字类别之一。
所以,在这个例子中,你是否应该定义一个“非数字”类并在一组图像上训练模型,模型可能会收到与手写数字无关的图像,这样无效图像就会被正确分类为“不是数字”?