区域提议方法在 Fast R-CNN 中如何工作?

人工智能 计算机视觉 物体检测 r-cnn 选择性搜索 更快的-r-cnn
2021-10-21 06:25:39

我阅读了很多文章和 Fast R-CNN 论文,但我仍然对区域提议方法在 Fast R-CNN 中的工作方式感到困惑。

如下图所示,他们说他们使用了一种提案方法,但没有具体说明它是如何工作的。

让我感到困惑的是,例如,在 VGGnet 中,最后一个卷积层的输出是形状为 14x14x512 的特征图,但是用于提出区域的算法是什么,它是如何从特征图中提出它们的?

在此处输入图像描述

1个回答

是的,没有具体说明,因为区域提议算法没有从 R-CNN 改变(之前的版本来自 Fast R-CNN,但是在下一个版本 Faster R-CNN 中,该算法被 CNN 取代)。

您正在寻找的区域提议算法称为选择性搜索。你可以在 R-CNN 论文中找到该算法在“Selective Search for Object Recognition”中的描述,我在这里找到了一份副本。

该算法基于输入图像的一系列分割和聚合技术,用于生成建议区域。检查在同一输入图像上进行 4 次分割和聚合迭代,以构建建议的区域。

在此处输入图像描述

算法所做的只是迭代 4 个步骤:

  1. 通过应用论文中描述的分割算法获得基于像素光强度分割的初始区域。例如,给定一张牧羊人与他的羊在山上的照片,将其按光强进行分割,得到图(a)的图像。
  2. 根据之前的分割提出不同的区域,图(e)
  3. 提议区域之间的相似度是使用论文第 3.2 节中公式 6 中提出的公式计算的,该公式无非是基于 4 个度量的两个区域相似度的聚合度量:颜色、纹理、大小和填充的相似度(衡量一个区域在另一个区域内的好坏)
  4. 根据相似性添加区域并得到图(b)。然后返回第二步。

这就是你如何迭代地获得所有描绘的图像。