数据挖掘 - 不平衡二元类的宏观和微观平均值 - 吾爱随笔录

数据挖掘机器学习阶级失衡评估

2022-02-25 23:18:17

微观和宏观平均是多类分类的指标。但是，对于数据不平衡时的二元分类，微观和宏观精度似乎有不同的结果。我的问题是：当类不平衡时，在二元分类问题中使用微观和宏观精度是否有意义？

1个回答

当类不平衡时，在二元分类问题中使用微观和宏观精度是否有意义？

一般来说，微观和宏观平均性能与二元分类无关，无论类是否平衡。如果存在严重的不平衡，它们的值可能会特别容易产生误导，因为它同时考虑了少数类（分类器更难）和多数类（更容易）：

当然，在某些情况下，不遵循此标准评估设置是有意义的，它始终是选择合适的方式来评估特定任务的问题。

下面的例子说明了为什么微观和宏观平均在标准的不平衡情况下会令人困惑：

              true A   true B
predicted A     90        9
predicted B      0        1

假设我们除了选择的性能度量之外什么都不知道，这个分类器：

查看混淆表，很明显分类器在区分两个类方面做得不好。所以最“诚实”的表现衡量标准是最后一个，即少数类的非平均表现。

其它你可能感兴趣的问题