什么是贴标机?

信息处理 图像处理 计算机视觉 图片
2022-02-12 10:23:12

我的计算机视觉/图像处理教授使用术语“标签”来表示图像的一部分,但无法以对我来说有意义的方式解释它是什么。她说这是一个有点普遍的术语,但不清楚它是什么。它有点类似于像素,但不同。我在任何地方都找不到定义。有什么想法/定义吗?

4个回答

标签是您附加到图像的一部分或像素的一些唯一 ID。您可以拥有与应用程序感兴趣的对象(或类)一样多的标签。

一些例子:

  • 在连通分量标签中,像素被分配一个标签,该标签通常只是一个数字,对应于像素所属的连通区域的 ID;
  • 在物体检测/识别中,标签是检测到的物体所属类别的名称或索引;
  • 在人脸识别中,标签将是已识别人的姓名,其人脸作为输入;
  • 等等

让我试着写一个更全面的答案。首先,正如@Aaron他的回答中暗示的那样,标签可以是一个相当笼统的术语根据您的应用程序,它可能与不同的事物有关。

所以,一般来说,正如@Aaron所说:当您必须对所有或部分图像像素进行分类时,标签对应于任何场合的类名此外,正如@sansuiso 所指出的,标签的确切含义取决于上下文

标签既可以是计算机分配的,_计算机确定/推断的_,也可以是人工分配的(通常由在某个领域被认为是“专家”的人分配)。让我举几个例子:

  • 如果应用是图像分割

    这里有几种可能的选择。最简单的将来自测试集,或用于分割的基本事实集:将要求“专家”分割图像,然后命名他们标记的每个部分/片段。

    第二个是运行分割算法而不依赖于测试集进行学习图像将以某种方式被分割(可能在预定数量的区域中,或取决于信噪比)。算法将简单地为这些区域分配数字标签区域 1区域 2等。

    第三种选择可能来自将分割算法的结果与地面实况数据库相结合:然后该算法可能会尝试确定图像区域的实际描述性标签

  • 对象检测对象分类中的用途

    对于这两者,您主要需要示例理想情况下,示例是仅包含您想学习如何检测或分类的对象的图像,但有时可以包含更多对象。数据库中的每个图像都需要由人处理,每个对象都正确标记(“分割”)和标记(例如“鸟”、“猫”、“树”、“书”)以创建学习集。

    这样一个数据库的一个例子是LabelMe,麻省理工学院要求人们在空闲时间标记一些图像,如果他们愿意的话。

    使用这些数据库,您可以进行对象检测分类对于分类,您通常只会为每个图像分配一个标签您尝试找到图像所代表的一个对象,然后据此对图像进行标记/分类。然后图像可能会得到标签“鸟”或“狗”。

    对于对象检测,您的算法只会“标记”或“分割”图像的一个或多个区域。然后为每个区域分配一个标签。或者,您可以为所有剩余的图像像素分配标签“背景”。

  • 卫星图像理解(也是一种分类)

    我见过这样的例子,对于卫星图像,您从一组预定的标签(通常是“建筑、植被、道路、水、地面”或类似的东西)中为每个像素分配了一个标签。您有一个小示例图像,或者可能只有 10% 的图像被标记。然后,您尝试学习图像其余部分中每个像素的标签。

    我会试着找到这样做的作品的链接,现在不记得了。


如您所见,您可以标记非常不同的事物: 整个图像单独的每个像素、图像的孤立区域分割中的所有区域

此外,标签可以是人类确定的、由算法确定的通用(数字)标签,或基于人类标记/标记的示例学习(以便人类可以理解)。

在计算机视觉中,您经常尝试对图像或图像的一部分进行分类。标签对应于类名。例如,如果您对一张人脸图像进行性别分类,那么标签将是男性和女性。如果您进行分割,那么标签可能对应于天空、汽车、街道等。

我认为潜在的区别在科学理论中被称为“测量水平”。

简单地说,问题是什么操作对值有意义:

  • CCD传感器在某个像素处测量的总能量是一个比率量:您可以比较两个亮度以找出哪个比另一个更亮,您可以将它们相加和相减,您可以将两个亮度值相除或将它们乘以一个标量常数,你会得到一个有意义的结果

  • 序数属性的典型示例是莫氏矿物硬度标度如果矿物 A 的硬度值为 4,矿物 B 的硬度值为 2,那么 A 会刮伤 B。您可以比较硬度值。当然,也可以加减矿物硬度值,但结果没有意义。

    如果您的相机传感器不是线性的,并且您不知道光能与生成的像素值之间的函数关系,则应将像素视为有序属性。

  • 名义属性可能是您的教授所说的“标签”:一个典型的例子是国籍(法国,美国,德国......)。即使您将它们表示为计算机内存中的整数,您也无法明智地将这些值相加或相乘。两个国籍之间的大于/小于也没有意义。两个标签之间唯一有意义的关系是相等/不等。