本质上支持多标签分类的算法

数据挖掘 机器学习 scikit-学习 多标签分类
2022-02-10 21:28:43

在 sklearn 的文档中,它说几种算法固有地支持多标签分类,例如 RandomForest 或 MLP:https ://scikit-learn.org/stable/modules/multiclass.html

它来自模型的实现还是结构?此外,这些算法是如何工作的?是 One-vs-the-Rest 策略还是其他?

谢谢。

1个回答

如果算法天生支持多标签分类,那么它通常是算法的隐含特征,而不是实现细节。

例如,MLP 固有地支持多标签分类,因为输出层对每个类都有一个感知器,并且每个感知器都输出该类的概率。输出向量将预测一个示例在所有标签中的成员资格。类似地,随机森林(或任何其他基于树的算法)的叶子可以包含任意长度的向量,这些向量描述了示例属于每个标签的概率。

one-vs-rest 策略用于将二元分类器(例如逻辑回归)推广到多项式问题。多项问题不同于多标签问题。

编辑:

澄清了我对多项式和多标签问题之间的区别的回答。