我最近读过这个:
“ AUC(Area Under Curve) 适用于类别不平衡的分类问题。假设任务是从语音中检测痴呆症,99% 的人没有痴呆症,只有 1% 的人患有痴呆症。那么你可以提交一个分类器,总是输出“没有痴呆”,这将达到 99% 的准确率。看起来你的 99% 准确率的分类器很好,但实际上它完全没用。使用 AUC 评分,你的分类器将得分 0.5。
有人可以解释为什么它达到0.5吗?如果 99% 为负数并且我们始终输出“否”,那是不是意味着 TruePositiveRate 将非常高而 FalsePositiveRate 非常低,从而导致曲线下面积接近 1?