在平衡数据上训练的二元分类器的精确召回曲线较差,测试数据不平衡
数据挖掘
分类
随机森林
阶级失衡
2022-03-01 13:41:21
1个回答
精确召回曲线和 ROC 曲线对类别不平衡的反应非常不同。精确召回曲线对不平衡非常敏感,而 ROC 曲线可以掩盖不平衡的影响。
对于 TPR (=recall) 和 FPR,您除以每个类中的真实样本数,而对于精度,您除以正预测数。
如果您的阳性样本很少,则假阳性和真阳性之间的比率会变得更加敏感(与假阳性 [few] 和所有真阴性 [many] 相比)。
根据您的用例,这可能是一个问题(或不是),应该是您评估的一部分。

