是否存在重新平衡/重新加权明显提高*准确性*的不平衡学习问题?

机器算法验证 不平衡类
2022-03-29 22:15:49

我一直在研究不平衡的学习问题,通常期望分类器过度偏向于多数类。但是,我很难识别类别不平衡确实是一个问题的数据集,此外,如果它实际上是一个问题,可以通过重新采样或重新加权数据来解决它。

任何人都可以给出真实世界(非合成)数据集的可重现示例,其中重新采样或重新加权可用于提高某些特定分类器系统的准确性(或等效的误分类错误率)(根据最佳实践应用时) ?

我只对作为性能指标的准确性感兴趣。有些任务的准确性应用程序中感兴趣的数量(例如,请参阅我对相关问题的回答),所以如果没有离题到正确的评分规则或其他性能度量的主题,我将不胜感激。

如果操作类频率与训练集中的频率不同或错误分类成本不相等,则不是类不平衡问题的示例。对成本敏感的学习是一个不同的问题。

0个回答
没有发现任何回复~