我正在使用 ROC 曲线和完整的 AUC 值来比较不同的模型,使用模拟数据。现在我想我对 ROC 曲线和 AUC 值的解释感到困惑。请看下图(对不起,它是屏幕截图的一部分......)
比较了三种模型,我知道绿色显示的模型应该是最好的。但是,如您所见,在FPR 达到 0.2 左右之前,绿色曲线优于其他两条曲线。这个 0.2 的截止值非常有趣:它是我在模拟中指定的差异表达基因的百分比(即 20% 的观察结果被模拟为阳性)。
我担心的是:
鉴于现实中人们很少会选择 0.5 或更高的 FPR 截止值,为什么人们更喜欢 FPR 范围为 0 到 1 的 ROC 曲线并使用完整的 AUC 值(即计算 ROC 曲线下的整个面积)来代替只是报告从 0 到 0.25 或 0.5 的面积?这就是所谓的“部分AUC”吗?
在下图中,我们可以说三款车型的表现如何?AUC 值为:绿色 (0.805)、红色 (0.815)、蓝色 (0.768)。红色曲线证明是优越的,但正如你所见,优越性仅在 FPR > 0.2 后才体现出来。谢谢 :)
