我有一个文本分类问题,其中“正面”的例子是少数。在这种情况下,什么指标更适合用于二进制分类 - F1 分数或 AUC?
使用 F1 分数或 AUC 指标进行不平衡数据分类是否更好?
数据挖掘
机器学习
评估
2022-02-23 22:22:05
1个回答
F1-score 和 AUC 是二元分类的两个评估指标,但它们没有可比性:
- F1-score 衡量硬分类器的性能,即为每个实例预测一个类别的系统。通过精确度和召回率,它将预测类与黄金标准类的每个实例进行比较。
- AUC 衡量软分类器的性能,即预测每个实例的概率(或分数)的系统。不同之处在于系统不决定实例属于哪个类,因此非正式地可以将其视为“未完成的分类器”。如果一个人决定了分类概率的阈值,那么它就变成了一个硬分类器。
两者都可以用于不平衡的数据,这不是选择其中一个的理由。
AUC 可用于在不决定特定阈值的情况下研究方法的一般行为。有时,特定阈值的选择会对性能产生很大影响,因此使用 AUC 可以完全避免该问题。但是严格来说,AUC 并没有给出分类器的性能。
其它你可能感兴趣的问题