多标签多类分类的激活方法和损失函数

数据挖掘 nlp 深度学习 多类分类 多标签分类 损失函数
2022-01-27 16:50:11

我正在使用CNN 进行 Yoonkim 的句子分类代码。这用于文本分类。我注意到他使用了 softmax 层和负对数似然错误。这对于单标签多类分类是最佳的。我现在有一个用于多标签多类分类的数据集。

  1. 理想的激活方法和误差函数是什么?
  2. 我觉得,使用 softmax 层会将概率总和设为 1,但在这种情况下,由于它属于不同的标签,因此在每个实例中,每个类的概率都可能很高。所以我认为 Softmax 并不是一个理想的选择。我对吗?
  3. 我找到了图像数据,但没有突出文本。任何人都可以向我推荐一些来源吗?
1个回答

假设所有标签都具有相同的重要性,您可以在输出中为每个类设置一个 sigmoid。对于每个课程,它会问,这个课程是否是这句话的一部分?损失只是输出的各个日志损失的总和。如果某些标签更重要,您可以在损失函数中相应地缩放它们。