在计算机视觉的背景下,“粗”和“细”这两个词是什么意思?

人工智能 卷积神经网络 计算机视觉 术语 图像分割 全卷积网络
2021-11-12 09:15:56

我正在阅读广为人知的论文Fully Convolutional Networks for Semantic Segmentation,并且在整篇论文中,他们都在谈论使用术语finecoarse我想知道它们是什么意思。他们第一次在介绍中说的是:

卷积网络正在推动识别方面的进步。卷积网络不仅在整幅图像分类方面有所改进,而且在具有结构化输出的本地任务上也取得了进展。其中包括边界框对象检测、部分和关键点预测以及局部对应方面的进步。

从粗推理到精细推理的自然下一步是对每个像素进行预测。

它也用于论文的其他部分

接下来,我们将解释如何将分类网络转换为产生粗略输出图的完全卷积网络。

在本文的上下文中,“粗”和“细”是什么意思?在计算机视觉的一般背景下?

在英语中,“粗”的意思是“质地或纹理粗糙或松散”,而“精细”的意思是“非常注重细节”或“(主要是木材)具有精细或细腻的纤维排列”,但这些定义确实没有在计算机视觉的上下文中阐明这些词的含义。

这个问题也被问到这里

1个回答

tl;博士

在本文的背景下,这意味着什么?

对于“粗略分割”,作者的意思是没有太多细节的分割。另一方面,“精细分割”是指具有高度细节的分割。

但更重要的是[在通用计算机视觉的背景下这意味着什么?

CV 中最常见的用途是描述一个类在分类中的一般或具体程度。“粗类”是一个非常广泛的类,而“细类”是一个非常具体的类。

有可能的使用

作者指的是结果分割的详细程度。

粗略分割意味着我们有大块覆盖每个类而没有太多细节。另一方面,精细分割将具有更高级别的细节,甚至可以下降到像素级别(即逐像素正确分割)。

为了清楚地说明这一点,请看以下两个示例。随着我们从左到右,分割图从粗到细:

请注意,在最右边的图像中,结果是一个几乎像素完美(即精细细节)的分割图,而左边的图像没有太多细节,可以认为是粗糙的。

替代用途

因为这不是一个既定的术语,所以有时粗略和精细可以指代分类任务中类的性质。以顶部图像为例;粗略分类任务的标签可以是对于一个精细的分类任务,我们会有橡树松树等标签。

最突出的例子是cifar数据集,它有两个版本:一个有 10 个类的粗略数据集和一个有 100 个类的精细数据集,它们都是粗略类的子类。例如粗类是,而细类是观赏鱼比目鱼鱼、鲨鱼鳟鱼等。

对于语义分割,一个示例可能如下:您想要制作街道分割模型。这种粗略分割意味着它只是将图像分割成道路车辆等。另一方面,精细分割还可以检测车辆的类型,例如卡车汽车等。