鉴于我有两个不平衡的多类数据集(分别为 21 和 16 个类),其中所有类都具有同等重要性,我应该使用什么类型的指标来评估我的分类模型?
我对基于宏观平均的指标选择深信不疑,例如宏 F1 和宏 TNR 等。基于上述输入的基于宏观平均的指标是否适合我的问题?
鉴于我有两个不平衡的多类数据集(分别为 21 和 16 个类),其中所有类都具有同等重要性,我应该使用什么类型的指标来评估我的分类模型?
我对基于宏观平均的指标选择深信不疑,例如宏 F1 和宏 TNR 等。基于上述输入的基于宏观平均的指标是否适合我的问题?
是的,宏观平均测量是这种情况下的标准选择:宏观平均分数只是每个班级的个人分数的平均值,因此它平等地对待每个班级。
对于严重不平衡的数据集,这意味着数据中只有少数实例的小类被赋予与多数类一样多的权重。由于前者通常更难被分类器正确识别,因此宏观平均性能值通常低于微观平均性能值(这当然是正常的)。