人工智能 - 当为同一对象预测一个或多个边界框时，非最大抑制如何工作？ - 吾爱随笔录

当为同一对象预测一个或多个边界框时，非最大抑制如何工作？

人工智能计算机视觉物体检测非最大抑制

2021-11-10 11:27:54

我对非最大抑制如何工作的理解是，它抑制了 Jaccard 重叠小于阈值（例如 0.5）的所有重叠框。要考虑的框是有信心的分数（可能是 0.2 或其他东西）。因此，如果有得分超过 0.2 的框（例如得分为 0.3，重叠为 0.4），则不会抑制框。

这样一来，一个物体会被很多个框、一个高分框、很多个低置信度框预测，但是我发现模型对一个物体只预测一个框。有人可以启发我吗？

我目前从https://github.com/sgrvinod/a-PyTorch-Tutorial-to-Object-Detection查看 ssd

这是代码。

#Finding Jaccap Overlap and sorting scotes
class_scores, sort_ind = class_scores.sort(dim=0, descending=True)
class_decoded_locs = class_decoded_locs[sort_ind]  # (n_min_score, 4)
overlap = find_jaccard_overlap(class_decoded_locs, class_decoded_locs)  
suppress = torch.zeros((n_above_min_score), dtype=torch.uint8).to(device)  

for box in range(class_decoded_locs.size(0)):
# If this box is already marked for suppression
    if suppress[box] == 1:
    continue
    suppress = torch.max(suppress, overlap[box] > max_overlap)
    suppress[box] = 0

1个回答

我也许可以在理论方面提供帮助，但编码......它是一个非标准的 API，例如 Tensorflow 或 Pytorch（它可能是我能说的自定义代码）。

这里的关键元素是，只有当边界框具有与与之重叠的框相同的类的预测时，边界框才会被移除（但信心较低，这就是它被移除的原因）。

这是一个例子，我们有：

两班 $c \in [c_1, c_2] = [$ “星星” $,$ “月亮” $]$
三个边界框

蓝色边界框保存类的预测 $c_1$ 所以他们的预测是 $p(c_1)_{box1} = 0.8$ 和 $p(c_1)_{box2} = 0.9$ . 另一方面，绿色框包含该类的预测 $c_2$ .

这三个框高度重叠，因此任何框之间的重叠 $x$ 与任何盒子 $y$ 将高于 IoU 阈值： $IoU(box_x, box_y) > 0.5$ . 所以原则上所有的盒子都容易被移除。

然而，NMS 仅适用于预测同一类的框（在蓝色的情况下）。所以 NMS 算法是：如果框是重叠的， $IoU(box_1, box_2) > 0.5$ ，这是真的，删除所有非最大类概率框。换句话说，只取最高的盒子 $p(c_1)$ 并删除其余部分。所以 $box_1$ 具有类概率 $p(c_1) = 0.8$ 将被删除。

那么绿色盒子会发生什么？不也是重叠的吗？是的，但考虑到绿色框不是在尝试预测同一个对象，而是在尝试预测另一个对象， $c_2$ ，恰好与第一个物体非常接近， $c_1$ . 通过这种方式，对象检测器支持检测不同的重叠对象。

其它你可能感兴趣的问题

上一篇用于特征选择的自动编码器网络不收敛下一篇逻辑回归的权重更新公式如何工作？