之间的连接d'd′(d-prime) 和 AUC(ROC 曲线下的面积);基本假设

机器算法验证 机器学习 奥克 信号检测 d-素数
2022-03-10 09:47:25

在机器学习中,我们可以使用ROC 曲线下的面积(通常缩写为AUC或 AUROC)来总结系统区分两个类别的能力。在信号检测理论中,通常d(敏感度指数)用于类似目的。两者紧密相连,如果满足某些假设,我相信它们是相互等价的

d计算通常基于假设信号分布的正态分布来呈现(例如,参见上面的维基百科链接)。ROC曲线计算没有做这个假设:它适用于任何输出可以阈值化的连续值决策标准的分类器。

维基百科d相当于2AUC1. 如果两者的假设都满足,这似乎是正确的;但如果假设不一样,那就不是普遍真理。

将假设的差异描述为“AUC 对基础分布的假设较少”是否公平?或者是d实际上与 AUC 一样广泛适用,但这只是人们使用的常见做法d倾向于使用假设正态分布的计算?我错过的基本假设还有其他差异吗?

1个回答

没有。AUC 的最大值是 1。d' 没有最大值。

我相信 d' 等于 qnorm(AUC)*sqrt(2) (我对一本旧的统计书的记忆,我现在找不到,但似乎检查了我在网上找到的一些数据)。这里 qnorm(x) 是“正态分布的分位数函数”(R-speak)。也就是说,它返回正态分布的值,其中分布的 x 比例低于它。