不平衡数据集的 ROC 曲线

机器算法验证 分类 不平衡类
2022-03-24 09:23:27

考虑一个输入矩阵X和一个二进制输出y.

衡量分类器性能的常用方法是使用 ROC 曲线。

在 ROC 图中,对角线是从随机分类器获得的结果。在输出不平衡的情况下y随机分类器的性能可以提高选择0或者1以不同的概率。

这种分类器的性能如何在 ROC 曲线图中表示?我想它应该是一条不同角度的直线,而不是对角线了?

ROC曲线示例

1个回答

ROC 曲线对类别平衡不敏感。您现在为随机分类器获得的直线已经是使用产生正数的不同概率的结果(0 带您到 (0, 0) 和 1 带您到 (1, 1) 之间的任何范围)。

在不平衡的环境中没有任何变化。