如果网格大小远小于测试图像中的对象,YOLO 算法如何检测对象?

数据挖掘 图像分类 图像识别 物体识别 约洛
2021-09-22 15:54:19

在此处输入图像描述

在 YOLO 算法中,如果模型是在具有完整图像的数据集上训练的,如果某些网格只看到汽车的一小部分黑色部分,这些网格如何输出预测?

1个回答

如果 YOLO 中的每个网格预测器检测到边界矩形的中心在其内部,则它应该只有一个对象在其中的高分。所以一个只包含汽车后视镜的网格点应该决定它包含汽车中心的概率很低。

预测的边界矩形不受相同方式的约束——YOLO 可以(并且经常这样做)从中心预测大于网格单元尺寸的边界框尺寸。

每个网格点都能够独立地预测它是否包含对象的中心、对象的边界框尺寸以及对象类别。

如果您跟踪层的连通性,您会看到网格单元在较低的输出层中有效地相互连接,因此整个网络“看到”每个对象的更多内容,并且可以影响单个对象的预测,当对象时抑制一些并鼓励其他对象跨越多个网格位置。网格单元不被隔离成多个部分,或者仅限于使用来自它们所覆盖区域的数据进行预测。特征“像素”可以从 CNN 中的基础图像访问每个图像的哪些部分的概念称为网络的“感受野”,并且可以根据 Medium 上的这篇博客中解释的架构来计算