多标签分类和模糊分类有什么区别?

数据挖掘 分类 多标签分类 模糊逻辑 模糊分类
2022-02-18 11:15:51

术语使用只是学者和实践者之间的关系吗?

或者是我们如何考虑每个样本的理论差异:同时属于多个类别还是属于一个模糊类别?

或者这种区别对我们如何建立分类模型有一些实际意义?

2个回答

多标签分类维基):

给定个类别,找到一个映射Kf:X{0,1}K

模糊分类(需要很好的引用!):

给定个类,找到一个映射其中Kp:X[0,1]Kk=1Kp(k)=1

在定义的多标签分类中,与模糊分类相比,类没有“资源限制”。

例如,带有softmax层的神经网络进行模糊分类(软分类)。如果我们只选择得分最高的一个类,那么它将成为单标签分类(硬分类),如果我们选择前个类,它将成为多标签分类(又是硬分类)。k

Fuzzy classification:        [0.5, 0.2, 0.3, 0, 0]
Single-label classification: [1,   0,   0,   0, 0]
Multi-label classification:  [1,   0,   1,   0, 0]

作为多标签分类的另一个示例,我们可以个神经网络,如果网络的输出高于 0.5 ,则将一个点分配给类别KKkk

Outputs:                     [0.6, 0.1, 0.6, 0.9, 0.2]
Multi-label classification:  [1,   0,   1,   1,     0]

实际考虑

如示例所示,关键区别在于模糊分类中存在“资源限制”,而多标签分类中则不存在。包括限制(在第一个示例中)或忽略它(在第二个示例中)取决于任务例如,在具有 互斥标签的分类任务中,我们希望包含“资源限制”以对模型施加“互斥”假设。

请注意,模糊分类中的限制仅仅是一个“定义”,争论一个定义是没有意义的。我们可以提出另一种分类,或者争论何时使用——何时不使用——这样的分类。k=1Kp(k)=1

多标签分类器学习使用一些算法和训练数据来预测类标签。它学习将对象的标签与一些包含特征值的向量相关联。它根据某些条件估计样本属于某个类别的概率。

模糊分类器做同样的事情,除了它使用模糊逻辑来确定样本属于哪个类别。与传统分类器使用的数据相反,需要使用语言规则来描述数据。在对样本进行分类时,它会为每个类返回一个“隶属度”。