为什么RPN中的分类器网络会输出两个分数?

人工智能 机器学习 卷积神经网络 物体识别
2021-10-25 18:35:35

Faster-RCNN 模型中的区域提议网络(RPN)包含一个分类器和一个回归器网络。为什么分类器网络会为每个锚点输出两个分数(对象和背景)而不是单个概率?这两个类不被认为是排他性的吗?

来源:Faster-RCNN 原论文图 3

1个回答

我只想提供这种直觉

  • 该 NN 由 2 步检测管道(并行的区域提案和回归 + 分类)组成,探索提案的一定范围的尺度和纵横比

  • 由于提议的区域是矩形的,并且感兴趣的对象严格来说不是矩形外观,而是一个主要是矩形的(具有不同的 AR),考虑到生成的检测 bbox 区域,一些像素将属于某个相关的对象外观(例如行人、汽车……),而 BBox 中的其他像素与该语义无关

  • 由于这不是语义分割,我们现在可以知道哪个像素实际上是相关的,但是对象性背景性可以以聚合的方式提供一个粗略的衡量标准

让我们假设在您的处理管道中的某个时刻,您有 2 个区域包含相同的汽车,但比例不同:因此理想情况下,它们都应该与 CarID 相关联,但很明显,一个区域包含的背景像素比另一个区域多得多并且您希望将其表示为附加措施