我制作了一个 LSTM 网络(隐藏大小为 16),在其中我给出了 10 个数字的序列作为输入,并将其输出提供给全连接层。
序列中的数字对应我创建的字典中的单词(例如:序列中的数字12对应字典中的第12个单词)
我想要的是使用该完全连接的层来预测下一个数字(即下一个单词),而我被困在那个地方。
我尝试的一种方法是在输出中创建一个具有relu
激活功能的神经元的 FC 层,并将其输出 a 转换为integer
并获取与该数字对应的单词。它的准确性太低了。
我想到的另一种方法是创建具有多个输出的 FC 并将其连接到一个softmax
层。然后得到它的输出,将输出转换为概率<0.5的二进制数为二进制0,其他为二进制1。然后得到对应的单词。我还没有尝试过这种方法。
我想问的是是否有更好的方法来做到这一点..?这类问题的一般解决方案是什么..?(可能是不同的架构)