我几乎已经阅读了大多数类似的问题,但我还没有找到我的问题的答案。
假设我们有n四个不同标签/类别的样本,即A、B、C和D。我们训练两个分类器:
First classifier:我们训练了一个多类分类器,将数据中的样本分类为四个类别之一。假设模型的准确率为 %x。Second classifier: 现在假设我们关心的是样本是 A 还是不是 A。我们训练了一个二元分类器,用于将样本分类为 A 或非 A。假设这个模型的准确率是 %y。
我的问题是,我们可以比较 x 和 y 来衡量分类器对 A 进行分类的性能吗?换句话说,多类分类器的高性能是否意味着分类器也能够以高性能识别单个类?
真实世界的例子是,我读过在包含四种不同类型文本的数据集上训练多类分类器的论文。他们取得了相当高的性能。但我关心的只是让模型能够正确分类一种特定类型的文本。我训练了一个精度较低的二元分类器。这是否表明我的模型在该类型的文本上效果不佳,而多类分类器的效果更好?还是我不应该比较这两者?