使用 RNN-LSTM 进行句子分类 - 输出层

数据挖掘 深度学习 rnn
2022-03-14 17:30:20

我已经阅读了一些关于使用 LSTM(有时与 CNN 结合)的 IMDB 练习 wrt 情绪分类的博客和论文,但是输出层只能包含 1 个带有 sigmoid 的神经元,因为情绪可能是好是坏。但是,如果我需要使用相同的技术将 30,000 个句子分类为 20 个不同的标签,那么我的输出层应该是什么样的?如果我没记错的话,我的输出层中的神经元数量应该与我训练数据的标签数量相同(在这种情况下为 20),每个标签都具有相同的 sigmoid。你能告诉我这是否有意义吗?

1个回答

在进行多类分类问题时,目标是为每个输入准确地预测一个类标签,使用 softmax 函数(归一化指数)作为最后一层的激活函数是标准的。但是,如果您的问题是多标签分类(其中类不是互斥的),那么使用 sigmoid 作为激活函数是合适的。在这两种情况下,您将拥有与标签一样多的输出单元(在您的情况下为 20 个)。