评估高度不平衡的二元分类的最佳指标是什么?(例如信用卡中的欺诈检测?
我已经检查了几个指标精度召回 F1 分类报告(宏观平均,加权平均),ROC,AUC,.. 但我不知道评估高度不平衡的二进制分类(例如信用卡欺诈检测https://www .kaggle.com/mlg-ulb/creditcardfraud
评估高度不平衡的二元分类的最佳指标是什么?(例如信用卡中的欺诈检测?
我已经检查了几个指标精度召回 F1 分类报告(宏观平均,加权平均),ROC,AUC,.. 但我不知道评估高度不平衡的二进制分类(例如信用卡欺诈检测https://www .kaggle.com/mlg-ulb/creditcardfraud
简单的precision/recall/F-score非常适合不平衡的数据。当然,它应该在少数类上计算。
ROC 和 AUC(也基于精确率/召回率)只能与软分类器一起使用,即当系统预测数值而不是二进制标签时。
宏观/微观/加权平均(通常超过 F 分数)是无关紧要的:对两个类别进行平均会考虑到很容易预测的多数类别,因此它会掩盖有关少数类别的有用信息。
这取决于您要解决的用例。假设在医疗保健中,您将其用于医疗诊断召回可能会优先考虑,因为假阴性可能会非常有害,但是在用例中,您提到欺诈检测,假阳性和假阴性都会产生可怕的影响,您会查看 F1 分数