低于随机的 ROC

数据挖掘 分类
2022-01-23 19:11:14

如果我有一个“比随机更差”的单个分类器 [y(x) 在 0...1 范围内] 的 ROC,即 ROC 的 AUC 小于 0.5,那么一个分类器是否会反转类预测[y'(x)=1-y(x)] 比随机更好?

2个回答

y(x)意味着您将使用的倒数),因为所有真正的肯定都会是错误的否定,反之亦然。因此,(因为 ROC 是一个递增函数并且在单位平方内),您的答案是肯定的。ROC=ROC1ROCAUC=1AUC

您可以按照您的说法反转预测,但您可能想确定发生这种情况的原因,以便模型更稳健,更容易相信或解释。在许多情况下进行反向预测可能很危险。

AUC 低 (< 0.5) 的一些原因:

1) 标签/特征不正确/颠倒

2)数据在训练和测试之间没有随机/正确拆分,因此训练和测试中的数据具有不同的模式 - 更有可能出现在不平衡的数据中

3)训练算法中的问题

4)可能过拟合

5)等