如何处理分类任务中类内的宽窄差异

数据挖掘 分类 多类分类 监督学习
2022-03-04 16:58:16

假设我正在做一个动物图像分类任务(它不一定是图像分类——这只是我的例子),并且训练和测试数据是跨类平衡的。课程可能是['gorilla', 'giraffe', 'dog', 'donkey']. 现在我们都知道,'dog'与其他三个班级相比,班级内的差异相对较大。

那么,有没有什么办法可以处理这个问题与另一个问题,即所有类都有大约相同的方差(例如,我可以用它代替'dog''sheep'

1个回答

您将希望有许多高方差类的不同示例,并选择具有高学习能力的模型。换句话说,大量的样本和一个大模型来捕捉数据的属性。

训练模型后,按类别查看保留数据集的混淆矩阵,以查看模型是否正在学习对所有类别进行泛化,包括高方差类别。