YOLO 中的网格单元数是如何确定的?

数据挖掘 神经网络 约洛
2022-03-12 04:49:41

我现在正在学习 YOLO 但我不明白网格单元的数量是如何确定的。像这篇文章这样的文章使用 13 x 13,而其他文章使用 19 x 19(例如 Andrew Ng 在 Coursera 中的课程)。看起来高度和宽度应该总是一样的,但它是如何确定的呢?

关于应该在其他网格单元格上拾取多少个网格单元格,是否有任何一般准则?

1个回答

据我所知,没有具体的规则。这将部分取决于您的场景将变得多么拥挤,您想要分别检测和定位的项目。创建高粒度网格会增加训练的计算成本,如果它只涵盖比基本算法所达到的检测精度要少得多的其他情况,则没有理由这样做。

选择可以由地面实况数据驱动。YOLO 的基本事实需要以具有类和边界矩形大小的网格位置的形式表示。如果您没有找到任何想要将两个项目的中心标记在同一个网格正方形内的训练示例,那么这很好地表明您的网格大小足够细粒度。

即使有一两个这样的冲突示例,您也可以证明在基本事实中仅标记一个项目是合理的,并且可以接受无法处理两个单独对象之间的紧密重叠的结果模型。即使使用较小的网格方块,YOLO 也可能无法学会分离对象,如果这种重叠很少发生的话。

我期望一个简单的收益递减规则适用。随着数据集变得越来越大,并且可以在更强大的计算机上训练对象检测,我们可能会看到最先进的模型仍然使用 YOLO,但具有更多的网格点。