语义分割:存在缺失类的平均 IOU

数据挖掘 计算机视觉 公制
2022-02-22 03:58:55

在我看来,在存在不平衡类的情况下,平均 IOU 是一个糟糕的指标。例如,假设我有 10 个类,但一张图像的标签中只有 2 个类。考虑倒置 2 个类的预测,这些类的 IOU 为 0,但其他 8 个类的 IOU 为 0/0。如果我们认为它是 1(因为没有对这些类的预测是正确的预测),使用统一的权重,得到的平均 IOU 为 0.8,这使得预测听起来非常好。

似乎目标图像中每个类对应的像素比例加权的平均 IOU 解决了这个问题。是否存在使用后来的过度统一平均 IOU 有问题的情况?为什么统一均值 IOU 在这两个指标中更受欢迎?

1个回答

您以某种方式误解了 mean_IOU 的计算方式。

首先,mean_IOU 不是按图像计算,然后对所有图像进行平均,而是对图像按类计算,然后对类进行平均。这意味着对于单个图像,如果缺少某些类别(在基本事实和您的预测标签中),您无需担心 0/0 情况。您只需要更新混淆矩阵,直到完成所有图像,然后计算 mean_IOU。

在极端情况下,所有图像中都缺少某些类。在这种情况下,您应该调整您的 num_class 参数。即使您不这样做,丢失的类也会被视为 IOU=0 而不是 1(可悲...)

例如,假设您的图像有 5 个像素并且您有 3 个类。地面实况向量始终为 [0,0,1,1,1] 并且您始终预测为 [1,1,0,0,0](请注意,您预测的第 0 类和第 1 类倒置,而第 2 类缺失)。在这种情况下,mean_IOU 是 0,而不是 1/3。

因此,您应该了解 IOU 已经通过所有图像中的小精灵数量(预测像素和地面实况像素的并集)的总和进行了归一化。所以我认为没有必要再重新加权 IOU。