“分类”和“标注”有区别吗?

数据挖掘 分类 术语
2021-10-02 20:15:55

直到最近,我还认为“标签”和“分类”是同义词。但是当我开始另一个关于计算机视觉术语的问题时,我想到了:“标签”和“分类”之间有区别吗?

我认为“类”是您要检测的概念,“标签”是您分配给数据的概念。所以“类”是一个通向数据的概念,“标签”只是名称。因此,“标签”与“分类”相同,因为两者都希望对导致数据的基础类做出声明。

文章

通过 Google Scholar 进行的快速搜索显示,一些文章在标题中同时使用了这两个术语:

  • Markus Eich、Malgorzata Dabrowska 和 Frank Kirchner:“语义标签:基于空间特征描述符的 3D 实体分类”
  • Chunlin Li、Dmitry B. Goldgof 和 Lawrence 0. Hall:“人脑 MR 图像的基于知识的分类和组织标记”
  • Ray Blanchard:“非同性恋性别焦虑症的分类和标签”——另一个研究领域,但可能这两个词之间的区别是一样的?

所以我想“标签”和“分类”之间是有区别的。有什么区别?

谷歌 N-Gram

在此处输入图像描述

分类似乎是一个更边界的术语。

4个回答

完全不同意@Derek Janni。小心符号,但你不应该迷失在术语中。您提到的那些论文从字面上使用了“标记”一词,但在机器学习/数据挖掘社区中,标记是为监督学习(分类)准备数据的过程!它与 ML 任务无关!

这些论文使用该术语来表明,在监督学习之后,他们可以识别不同对象的不同标签,因此他们使用了术语标签,但您可能在任何文献中都找不到他们将这两个术语用作同义词。

我看待它的方式:“分类”(在机器学习的背景下)是一种问题,您将“标签”分配给对象。形式上,“分类”是一种问题,而标签是从对象到一组标签(可能是无限的)的函数。

就像回归是一种问题一样,您再次为对象分配标签,只是这次标签是某个实数。

在分类和回归中,您都试图找到关于某些度量/损失函数的“最佳”标签函数。

在阅读了更多论文并与许多人讨论了机器学习主题之后,我是这样定义这些词的:

作为存在的抽象概念类。每个类都有属性,可以有很多不同的标签。例如,类cat具有属性“feet”(值为 4),属性“Genus”具有值“Felis”。班级成员的样子有很多种。还有很多标签:猫、Katze、Felis silvestris、🐱、🐈。

标签只是您贴在概念上的标签一个名字。我们需要一个词来谈论这个概念。

我将标签用于定义数据集的哪些部分属于哪个类的手动过程。我将分类用于自动分类器决定数据的哪一部分属于哪个类的过程。因此,通常,标记由人工完成,然后由机器进行分类。

简短的回答:

不,标签和分类之间没有区别。

类 - 一组或类别的事物,具有某些共同的属性或属性,并通过种类、类型或质量与其他事物区分开来。参见“类别”。

标签 - 表示后面的内容属于特定类别或类别的单词或短语。

对事物进行分类就是对其进行标记,它们必然是同一事物。术语标签可能会演变,因为“标签”允许您避免说在计算机科学中具有其他含义的“类”。

标签要简单得多,在所有情况下,分类只是将标签放在对象上的行为(或学习正确地这样做)。

您在使用标签/分类时看到的差异来自一个简单的事实,即标题如下:

《语义分类:基于空间特征描述符的 3D 实体分类》或《人脑 MR 图像的基于知识的分类和组织分类》

听起来真的很尴尬。

像大多数学术论文标题一样,这些只是对论文内容的过于复杂的描述,可以准确地解释正在发生的事情,而不会听起来多余。

TL;DR - 不要纠结于术语!