在类不平衡的数据集上测试分类器时,精确召回曲线被认为比 ROC 曲线更好。
这种说法是完全错误的。
一般来说,像“X 比 Y 好”这样的陈述应该持保留态度。它通常取决于用例,您的目标是什么等。但是,上面的陈述比这更错误。让我们来看看。
PR 曲线绘制以下参数:
精度 = TP/(TP+FP)
召回 = TP/(TP+FN)
请注意等式中没有真阴性 (TN) 吗?
当正面例子很少时, PR 曲线很有用。如果你的数据集与罕见的负数不平衡,你绝对不应该使用 PR 曲线。
正如您在实验中注意到的那样,并且您已经正确推理,ROC 曲线对类别不平衡不敏感。这意味着如果您平衡数据(即重新采样),ROC 曲线不会改变(假设您不重新训练模型)。
当数据集只包含几个正例时,您需要关心一个新问题:正预测值(= PPV = Precision)。具体来说:给定一个观察被归类为正例,它真正为真正例的概率是多少?当积极的例子很少时,这个问题的答案可能会令人惊讶地误导。
PPV 和 NPV(补充:假设观察结果是否定的,真阴性的概率是多少)在平衡数据集中通常不是问题,因为它们遵循通常的敏感性和特异性。PPV 和 NPV 仅在不平衡数据集中变得至关重要,因为这两个度量对类别不平衡很敏感,这与 ROC 曲线不同。因此 ROC 曲线可能会掩盖 PPV 和 NPV 较差的模型,这在不平衡的情况下可能是一个问题。PR 曲线将立即突出显示 PPV 较差的模型并完全忽略 NPV。
因此,最终由您决定使用哪种工具。不要因为不平衡就使用 PR 曲线。正面例子很少见吗?它们在您的样品中特别罕见吗?然后坚持使用 ROC 曲线。他们在普通人群中很少见吗?然后你应该考虑精度并查看 PR 曲线。负面案例很少见吗?然后坚持ROC曲线。