不平衡数据集信息量最大的曲线

数据挖掘 机器学习 分类 阶级失衡 不平衡学习
2022-02-04 19:21:38

对于不平衡的数据集:

  1. 我们可以说 Precision-Recall 曲线比 ROC 曲线信息量更大,因此更准确吗?
  2. 在这种情况下,我们可以依靠 F1 分数来评估结果模型的技巧吗?
1个回答

在Saito 和 Rehmsmeier 的“在评估不平衡数据集上的二元分类器时,Precision-Recall 图比 ROC 图更能提供信息”中,Precision-recall 曲线被认为比 ROC 曲线更有用。他们认为 ROC 可能会导致对特异性的错误视觉解释。

F1 分数同样平衡了准确率和召回率。在某些领域,更重的权重精度(F < 1)或召回率(F > 1)可能更有用。