一个训练集有五个类,包括:
"label-A", "label-B", "label-C", "label-D", "others"
但问题要简单得多——就是判断每个输入是否属于"label-ABCD"或"others"。在这种情况下,我认为有两种解决方案可以解决这个问题。
解决方案 1:训练一个 5 类分类器,当分类器预测输入为"label-A"or"label-B"或"label-C"or"label-D"时,我们将其重新标记为"label-ABCD"。
解决方案 2:训练一个 2 类分类器,我们将数据重新标记"label-ABCD"为标记为"label-A"or"label-B"或"label-C"or "label-D"。然后它变成了一个二分类问题。
我的问题是:
模型在“定理”中哪一种方式可以得到更好的表现?
在实际情况下,这两种情况通过 CNN 分类模型得到几乎相同的性能,我想知道我是否采用 C4.5、朴素贝叶斯、SVM 等较弱的分类器……哪种方法会胜出?
谢谢!!