Faster R-CNN:当有很多类时,关于正锚的标签

数据挖掘 机器学习 深度学习 图像识别 物体识别
2022-02-23 11:36:36

Faster R-CNN 的原始论文的作者在提到正锚时,他们被标记为 1。我猜他们指的是二进制分类。在我们有两个以上类的任务中会发生什么?

我的意思是 RPN 的目的是只生成区域建议(有没有对象,不管标签)还是生成区域建议和相应的标签?我想这是第二种情况,因为参与训练过程的正锚也需要有一个真实标签,即(猫、狗等)。

但是,我可能会误解事物并以错误的方式解释事物。

1个回答

与 R-CNN 和 Fast R-CNN 中用于区域提议的算法一样,Faster R-CNN 中的 RPN 任务是提议可能是也可能不是对象的区域,因此它的 cls head 具有 2k 分数对应于将每个锚点分类为对象或非对象(这样它们都可能是非对象):在此处输入图像描述

但它也可能是 ak 分数逻辑回归(k sigmoids 0 到 1),正如他们在论文的第四个注释中所述:

  1. 为简单起见,我们将 cls 层实现为两类 softmax 层。或者,可以使用逻辑回归来产生 k 个分数

在生成proposal之后,使用Fast R-CNN对每个选择的proposal进行分类和改进,即下图中的灰色区域:

在此处输入图像描述

因此,您可以更好地概念化 Fast 和 Faster R-CNN 之间的区别,将区域提议生成算法视为一个黑匣子,可以填充一个 RPN 头,该 RPN 头连接到用作主干的深度网络的输出卷积特征图,或者R-CNN 和 Fast R-CNN 使用的标准选择性搜索