没有“活动”类的不平衡二元分类的性能指标是什么?

机器算法验证 机器学习 分类 不平衡类 模型评估
2022-03-16 10:18:49

我的数据集有两个类 A 和 B。应该平等对待这些类(没有“活动/非活动”)。数据集是不平衡的,有时 A 更频繁,有时 B 更频繁。我应该使用哪种绩效衡量标准?

准确性对不平衡的数据集毫无意义。如果我做对了,F-measure 和 AUC 假设有一个活动类别:F-measure 忽略真正的否定,因为它是精度和召回率的调和平均值。AUC 忽略真阴性和假阴性。

那么我应该使用什么性能指标呢?AUC(active=A) + AUC(active=B) / 2 是一个有效的选项吗?

更正:

显然,我误解了 AUC 的工作原理。它不会忽略真阴性和假阴性。ROC 曲线看起来不同,具体取决于哪个类被认为是活跃的,但 AUC(active=A) = AUC(active=B)。

1个回答

看看马修斯相关系数

MCC=TPTNFPFN(TP+FP)(TP+FN)(TN+FP)(TN+FN)

我经常看到它作为 SNP 数据集分类的性能指标。也看看这个链接,他们讨论了 AUC 和 MCC 之间的区别

否则,您可以只计算平均准确率(平均错误率),我也看到人们在多类问题中使用它。

AAcc=12(TPTP+FN+TNTN+FP)

通常它以一半总错误率的形式用于身份验证系统。例如,他们在这里提供了一个统计测试。