我正在解决图像分类问题。但是有些照片可能不属于任何类别,我不想提供任何虚假信息,而是为了捕捉这种情况。有什么方法可以做到。我想到的一个想法是给一个额外的类别“其他”,但是我需要为这个类别提供一些数据,因为它太笼统而难以收集。
修改神经网络分类器以处理来自标签集之外的样本点的方法是什么?
数据挖掘
神经网络
分类
标签
2021-09-18 04:57:35
1个回答
这个问题是一个很常见的问题。如何处理样本属于数据集中未包含的类别。没有最佳的方法来处理这个问题:
创建一个单独的类是可能的,但不推荐。首先,你需要从图像开始,其次这个类在类中会有很大的变化,这是一个不利的特性,这使得设计一个强大的分类器来处理其他类更具挑战性,并且通常会导致一个低质量的分类器。
我更喜欢通过衡量信心来处理这个问题。如果您预计会有异常/异常值,请确保使用同时提供预测和概率(置信度)的分类器。
CNN 已经足够好了,只有当置信度高于某个阈值,或者最高置信度(标签)与下一个置信度(标签)之间的差值高于某个阈值时,您才能接受预测。大多数基于概率的分类都可以为您提供置信度值。
可以更改其他一些分类器以赋予置信度,例如,您可以分析用于为决策树中的休假提供标签的训练数据,可以将属于同一休假的这些样本聚类以获得一些质心。在预测中,您可以预测标签并测量目标(测试样本)与属于同一叶的每个质心之间的最短距离,该最短距离可以用作置信度的度量,并且可以与接受/拒绝预测的阈值。
请注意,这个问题仍在研究中,没有明确的答案。它需要对每个分类器进行非常深入的了解才能对其进行修改/或添加以测量置信度并了解该测量的含义
其它你可能感兴趣的问题