如何将神经网络应用于多标签分类问题?

机器算法验证 机器学习 神经网络 自然语言 多标签
2022-03-27 08:02:09

描述:

假设问题域是存在一组特征向量的文档分类,每个特征向量属于一个或多个类。例如,一个文档doc_1可能属于SportsEnglish类别。

问题:

使用神经网络进行分类,特征向量的标签是什么?它会是一个由所有类组成的向量,使得不相关类的值为 0,相关类的值为 1?因此,如果类标签的列表是[Sports, News, Action, English, Japanese],那么对于文档doc_1,标签将是[1, 0, 0, 1, 0]

2个回答

这似乎是您正在寻找的论文:

张敏玲和周志华:多标签神经网络在功能基因组学和文本分类中的应用

从摘要:

在多标签学习中,训练集中的每个实例都与一组标签相关联,任务是为每个未见过的实例输出一个大小未知的标签集。提出了一种名为BP-MLL的神经网络算法,即Backpropagation for Multi-Label Learning。... 对两个现实世界的多标签学习问题(即功能基因组学和文本分类)的应用表明,BP-MLL 的性能优于一些成熟的多标签学习算法。

是的,在多标签学习中,标签信息通常被编码为您描述的二进制向量。评估也更容易。

我们可能想查看MULAN,这是一个用于多标签学习的开源 Java 库。它是 Weka 的扩展,实现了许多多标签分类器,包括神经网络。例如,您可以在此处找到 BP-MLL 。