使用多类而不是多标签分类是不好的做法吗?

数据挖掘 Python 分类 多类分类 多标签分类
2022-02-23 06:39:12

我有一个多标签分类问题——数百万条记录可能包含多个标签。我遇到了与缺乏在线研究/示例相关的问题,并且无法创建强大的模型。是否建议不要建立多类分类模型,并将预测概率超过 0 的任何标签视为潜在标签?即使有问题转换,如二元相关性和分类器链,与使用朴素贝叶斯并获得约 57% 的准确度相比,准确度也非常低 (~12%)。

1个回答

也许我理解错了,但是多标签多类问题是根本不同的,因为多类是互斥的(没有实例可以同时分为两个类),而多标签放宽了这个条件. 正如关于多标签的维基百科所说:

在多标签问题中,实例可以分配到多少个类没有限制。

所以,使用多类或多标签取决于问题本身,而不是你如何解决它。