Kaggle 比赛的 AUC ROC 指标
数据挖掘
机器学习
分类
阶级失衡
卡格尔
2021-10-09 10:42:07
1个回答
正如您在研究中看到的那样,AUC ROC 优先考虑使预测的顺序正确,而不是逼近真实频率。
通常,就像您链接到的信用卡欺诈问题一样,一两个误报的影响比许多误报更具破坏性。如果这些类是不平衡的,就像他们在欺诈案件中一样,AUC ROC 是个坏主意。
看来,在您所指的比赛中,主持人更感兴趣的是标记哪些评论比其他评论更具毒性,而不是评价它们各自的毒性有多大。这是有道理的,因为实际上标签是主观的。