目前,我有一个平衡的数据集(我人为地对其进行过采样以使其平衡)。我的课程是二进制的(0 或 1)。我想知道“准确性”是否是在数据集具有大致相等的类平衡的情况下使用的“最佳”指标?
不过,更广泛地说,是否有一个很好的“经验法则”或“最佳实践”来确定根据数据集的类标签“分布”使用哪个评分指标(准确度、精确度、召回率、AUC ......)。
我能想到的常见场景有:
二进制分类
- 0级高度不平衡
- 1类高度不平衡
- 大致相等的班级数量
- 最后,想象一个 75/25 的比率
多类分类
- 大多数样本都由一个类控制(在我的经验中很常见)
- 类的数量大致相同
- 许多类标签,每个样本很少(想象 1000 个样本,100 个类,每个样本有 2 到 20 个样本)
我知道通过改变数据集的样本数量来处理不平衡的技术,例如欠采样和过采样,但是假设您在这种情况下没有这样做。哪些指标最适合上述场景?