您如何执行也是多类问题的多标签分类?

数据挖掘 分类 scikit-学习 多类分类 多标签分类
2022-03-16 02:28:19

我有一个数据集,其中每一行数据都属于某些类/标签。

文本 第一类 类2 3级
文本1 位置 否定
文本2 否定
文本3
文本4 位置 否定 否定
文本5 否定 否定

基本上有 4 个类,每个类有 3 个标签 ( pos, neg, neu, na)。我想这既是多类问题又是多标签问题。我该如何处理?我正在使用BinaryRelevance函数,multisklearn但结果总是只返回 2 个类(0 和 1)。这样做的正确方法是什么?

1个回答

从描述来看,这不是多标签问题,因为:

  • 三个“类”(列)中的每一个都必须有一个标签。在多标签问题中,每个类都是可选的。
  • 每个“类”(列)似乎都有细分为 4 个标签的特定用途。在一个常规的多标签问题中,标签是可交换的,例如,一个文档可以有主题“体育”和“社会”但不能有“政治”,所有这些标签都没有顺序,也没有与其他标签不同的特定角色。

看来您只是有三个常规的独立多类问题:

  • 问题 1 = 预测“第 1 类”
  • 问题 2 = 预测“第 2 类”
  • 问题 3 = 预测“第 3 类”

注意:列的“类”一词令人困惑,因为它们不对应于类的常规概念。