阅读评估指标的分类报告?
数据挖掘
Python
分类
scikit-学习
2022-02-06 18:05:09
1个回答
是精度= 56% 还是 25% 以及召回率和 f1 分数?
不,因为精度、召回率和 f1-score 仅针对二元分类定义,而本报告是关于多类分类问题(有 8 个类)。
注意:为了理解这种分类报告,首先需要了解事物在混淆矩阵中是如何工作的(使用 sklearn 可以使用函数confusion_matrix
)。混淆矩阵为每个真实类 X 和每个预测类 Y 显示具有真实类 X 并被预测为类 Y 的实例的数量。分类报告中的值是从混淆矩阵中计算出来的,这是一个很好的练习手动计算几次,以了解分类报告中的工作方式。
- 分类报告第一部分中的每一行都侧重于一个类 X 与任何其他类。这意味着它给出了准确率、召回率和 f1 分数值,就好像只有两个类别:X 和“非 X”。
- 在报告的第二部分中,精度、报告和 f1 分数值是跨类汇总的。但是有不同的方式来聚合它们,每种方式都意味着不同的东西(另见这个问题)。
- 宏观平均是跨类的简单平均。这意味着它不关心每个类有多少实例,它认为所有实例都同等重要。
- 加权平均加权每个类值及其在数据中的比例。这意味着它对大类比对小类更重要,因此它倾向于掩盖小类的问题。
这个分类器有一个共同的问题:它忽略了所有的小类,只预测了 3 个最大的类 3,4 和 7。
其它你可能感兴趣的问题