在机器学习中,我们可以使用ROC 曲线下的面积(通常缩写为AUC或 AUROC)来总结系统区分两个类别的能力。在信号检测理论中,通常(敏感度指数)用于类似目的。两者紧密相连,如果满足某些假设,我相信它们是相互等价的。
这计算通常基于假设信号分布的正态分布来呈现(例如,参见上面的维基百科链接)。ROC曲线计算没有做这个假设:它适用于任何输出可以阈值化的连续值决策标准的分类器。
维基百科说相当于. 如果两者的假设都满足,这似乎是正确的;但如果假设不一样,那就不是普遍真理。
将假设的差异描述为“AUC 对基础分布的假设较少”是否公平?或者是实际上与 AUC 一样广泛适用,但这只是人们使用的常见做法倾向于使用假设正态分布的计算?我错过的基本假设还有其他差异吗?