我正在针对以下任务训练 RNN:给定 30 个单词的序列,预测下一个单词。
在我的网络中拥有超过 30 个单元(LSTM、GRU 或普通 RNN)有什么好处?
我在网上看到很多例子,其中类似的网络是用多层训练的,每层都有 100 个单元,但这对我来说没有意义。
拥有比序列长度更多的细胞有什么帮助?(在我的情况下,这个长度是 30)
我很困惑,因为据我了解,每个单元格接受两个输入
1. 序列的一个新元素
2. 前一个单元格的输出
所以在 30 个单元格之后,不会有新的序列元素输入到单元格中。每个单元格将只处理前一个单元格的输出(不接收新信息)。
我正在使用 LSTM 单元来完成这项任务(但是,我猜测所使用的 RNN 单元的实际类型无关紧要)。