术语使用只是学者和实践者之间的关系吗?
或者是我们如何考虑每个样本的理论差异:同时属于多个类别还是属于一个模糊类别?
或者这种区别对我们如何建立分类模型有一些实际意义?
术语使用只是学者和实践者之间的关系吗?
或者是我们如何考虑每个样本的理论差异:同时属于多个类别还是属于一个模糊类别?
或者这种区别对我们如何建立分类模型有一些实际意义?
多标签分类(维基):
给定个类别,找到一个映射。
模糊分类(需要很好的引用!):
给定个类,找到一个映射其中。
在定义的多标签分类中,与模糊分类相比,类没有“资源限制”。
例如,带有softmax层的神经网络进行模糊分类(软分类)。如果我们只选择得分最高的一个类,那么它将成为单标签分类(硬分类),如果我们选择前个类,它将成为多标签分类(又是硬分类)。
Fuzzy classification: [0.5, 0.2, 0.3, 0, 0]
Single-label classification: [1, 0, 0, 0, 0]
Multi-label classification: [1, 0, 1, 0, 0]
作为多标签分类的另一个示例,我们可以个神经网络,如果网络的输出高于 0.5 ,则将一个点分配给类别
Outputs: [0.6, 0.1, 0.6, 0.9, 0.2]
Multi-label classification: [1, 0, 1, 1, 0]
如示例所示,关键区别在于模糊分类中存在“资源限制”,而多标签分类中则不存在。包括限制(在第一个示例中)或忽略它(在第二个示例中)取决于任务。例如,在具有 互斥标签的分类任务中,我们希望包含“资源限制”以对模型施加“互斥”假设。
请注意,模糊分类中的限制仅仅是一个“定义”,争论一个定义是没有意义的。我们可以提出另一种分类,或者争论何时使用——何时不使用——这样的分类。
多标签分类器学习使用一些算法和训练数据来预测类标签。它学习将对象的标签与一些包含特征值的向量相关联。它根据某些条件估计样本属于某个类别的概率。
模糊分类器做同样的事情,除了它使用模糊逻辑来确定样本属于哪个类别。与传统分类器使用的数据相反,需要使用语言规则来描述数据。在对样本进行分类时,它会为每个类返回一个“隶属度”。