数据挖掘 - 使用多类而不是多标签分类是不好的做法吗？ - 吾爱随笔录

使用多类而不是多标签分类是不好的做法吗？

数据挖掘 Python 分类多类分类多标签分类

2022-02-23 06:39:12

我有一个多标签分类问题——数百万条记录可能包含多个标签。我遇到了与缺乏在线研究/示例相关的问题，并且无法创建强大的模型。是否建议不要建立多类分类模型，并将预测概率超过 0 的任何标签视为潜在标签？即使有问题转换，如二元相关性和分类器链，与使用朴素贝叶斯并获得约 57% 的准确度相比，准确度也非常低 (~12%)。

1个回答

也许我理解错了，但是多标签和多类问题是根本不同的，因为多类是互斥的（没有实例可以同时分为两个类），而多标签放宽了这个条件. 正如关于多标签的维基百科所说：

在多标签问题中，实例可以分配到多少个类没有限制。

所以，使用多类或多标签取决于问题本身，而不是你如何解决它。

其它你可能感兴趣的问题

上一篇两个神经网络对分类的加权影响下一篇Dueling DQN - Advantage Stream，为什么使用平均值而不是 tanh？