数据挖掘 - 多标签分类和模糊分类有什么区别？ - 吾爱随笔录

多标签分类和模糊分类有什么区别？

数据挖掘分类多标签分类模糊逻辑模糊分类

2022-02-18 11:15:51

术语使用只是学者和实践者之间的关系吗？

或者是我们如何考虑每个样本的理论差异：同时属于多个类别还是属于一个模糊类别？

或者这种区别对我们如何建立分类模型有一些实际意义？

2个回答

多标签分类（维基）：

给定个类别，找到一个映射。 $K$ $f:X \rightarrow \{0, 1\}^K$

模糊分类（需要很好的引用！）：

给定个类，找到一个映射其中。 $K$ $p: X \rightarrow [0, 1]^K$ $\sum_{k=1}^{K} p(k)=1$

在定义的多标签分类中，与模糊分类相比，类没有“资源限制”。

例如，带有softmax层的神经网络进行模糊分类（软分类）。如果我们只选择得分最高的一个类，那么它将成为单标签分类（硬分类），如果我们选择前个类，它将成为多标签分类（又是硬分类）。 $k$

Fuzzy classification:        [0.5, 0.2, 0.3, 0, 0]
Single-label classification: [1,   0,   0,   0, 0]
Multi-label classification:  [1,   0,   1,   0, 0]

作为多标签分类的另一个示例，我们可以个神经网络，如果网络的输出高于 0.5 ，则将一个点分配给类别 $K$ $K$ $k$ $k$

Outputs:                     [0.6, 0.1, 0.6, 0.9, 0.2]
Multi-label classification:  [1,   0,   1,   1,     0]

实际考虑

如示例所示，关键区别在于模糊分类中存在“资源限制”，而多标签分类中则不存在。包括限制（在第一个示例中）或忽略它（在第二个示例中）取决于任务。例如，在具有互斥标签的分类任务中，我们希望包含“资源限制”以对模型施加“互斥”假设。

请注意，模糊分类中的限制仅仅是一个“定义”，争论一个定义是没有意义的。我们可以提出另一种分类，或者争论何时使用——何时不使用——这样的分类。 $\sum_{k=1}^{K} p(k)=1$

多标签分类器学习使用一些算法和训练数据来预测类标签。它学习将对象的标签与一些包含特征值的向量相关联。它根据某些条件估计样本属于某个类别的概率。

模糊分类器做同样的事情，除了它使用模糊逻辑来确定样本属于哪个类别。与传统分类器使用的数据相反，需要使用语言规则来描述数据。在对样本进行分类时，它会为每个类返回一个“隶属度”。

其它你可能感兴趣的问题

上一篇如何解读这个“Zipf”（生存、战争伤亡）情节？下一篇有人有水果疾病数据集吗？