为什么对于不平衡的数据集,PR 曲线被认为比 ROC 曲线更好?

机器算法验证 分类 不平衡类
2022-03-05 18:16:38

我从多个来源听说,在类不平衡的数据集上测试分类器时,精确召回曲线被认为比 ROC 曲线更好。 https://www.biostat.wisc.edu/~page/rocpr.pdf https://towardsdatascience.com/what-metrics-should-we-use-on-imbalanced-data-set-precision-recall-roc- e2e79252aeba

如果是这种情况,我希望如果我获取一个不平衡的数据集并对其进行重新采样以使其平衡,它将产生与原始数据集显着不同的 ROC 曲线。但是根据我的经验,根据我的实验原因,情况并非如此

任何人都可以向我解释 ROC 曲线如何成为平衡数据集分类准确度的一个很好的衡量标准,但对于不平衡数据集却不是,因为两者的 ROC 曲线似乎基本相同?

2个回答

在类不平衡的数据集上测试分类器时,精确召回曲线被认为比 ROC 曲线更好。

这种说法是完全错误的。

一般来说,像“X 比 Y 好”这样的陈述应该持保留态度。它通常取决于用例,您的目标是什么等。但是,上面的陈述比这更错误让我们来看看。

PR 曲线绘制以下参数:

精度 = TP/(TP+FP)

召回 = TP/(TP+FN)

请注意等式中没有真阴性 (TN) 吗?

正面例子很少时, PR 曲线很有用如果你的数据集与罕见的负数不平衡,你绝对不应该使用 PR 曲线。


正如您在实验中注意到的那样,并且您已经正确推理,ROC 曲线对类别不平衡不敏感这意味着如果您平衡数据(即重新采样),ROC 曲线不会改变(假设您不重新训练模型)。

当数据集只包含几个正例时,您需要关心一个新问题:正预测值(= PPV = Precision)。具体来说:给定一个观察被归类为正例,它真正为真正例的概率是多少?当积极的例子很少时,这个问题的答案可能会令人惊讶地误导。

PPV 和 NPV(补充:假设观察结果是否定的,真阴性的概率是多少)在平衡数据集中通常不是问题,因为它们遵循通常的敏感性和特异性。PPV 和 NPV 仅在不平衡数据集中变得至关重要,因为这两个度量对类别不平衡很敏感,这与 ROC 曲线不同。因此 ROC 曲线可能会掩盖 PPV 和 NPV 较差的模型,这在不平衡的情况下可能是一个问题。PR 曲线将立即突出显示 PPV 较差的模型并完全忽略 NPV。

因此,最终由您决定使用哪种工具。不要因为不平衡就使用 PR 曲线。正面例子很少见吗?它们在您的样品中特别罕见吗?然后坚持使用 ROC 曲线。他们在普通人群中很少见吗?然后你应该考虑精度并查看 PR 曲线。负面案例很少见吗?然后坚持ROC曲线。

这是一个有趣的问题。我不同意大多数人说 ROC 对于不平衡数据总是很糟糕的说法。这实际上取决于用例以及您想对 ROC 曲线说什么。

我认为为什么有些人认为 ROC 是衡量不平衡问题的一个坏指标,可能是因为它主要关注正面例子,而忽略了其他(负面)类。

即,在 ROC 曲线中,您有 TP/P 和 FP/N。

使用 Precision-Recall 曲线,您还可以通过召回 TN/N 关注正确预测的负例(即,真正的负例 TN 是造成差异的原因)。

在任何一种情况下,我都不会说 PRE-REC 总是优于 ROC 曲线,这实际上取决于上下文。