描述:
假设问题域是存在一组特征向量的文档分类,每个特征向量属于一个或多个类。例如,一个文档doc_1
可能属于Sports
和English
类别。
问题:
使用神经网络进行分类,特征向量的标签是什么?它会是一个由所有类组成的向量,使得不相关类的值为 0,相关类的值为 1?因此,如果类标签的列表是[Sports, News, Action, English, Japanese]
,那么对于文档doc_1
,标签将是[1, 0, 0, 1, 0]
?
描述:
假设问题域是存在一组特征向量的文档分类,每个特征向量属于一个或多个类。例如,一个文档doc_1
可能属于Sports
和English
类别。
问题:
使用神经网络进行分类,特征向量的标签是什么?它会是一个由所有类组成的向量,使得不相关类的值为 0,相关类的值为 1?因此,如果类标签的列表是[Sports, News, Action, English, Japanese]
,那么对于文档doc_1
,标签将是[1, 0, 0, 1, 0]
?
这似乎是您正在寻找的论文:
张敏玲和周志华:多标签神经网络在功能基因组学和文本分类中的应用
从摘要:
在多标签学习中,训练集中的每个实例都与一组标签相关联,任务是为每个未见过的实例输出一个大小未知的标签集。提出了一种名为BP-MLL的神经网络算法,即Backpropagation for Multi-Label Learning。... 对两个现实世界的多标签学习问题(即功能基因组学和文本分类)的应用表明,BP-MLL 的性能优于一些成熟的多标签学习算法。