LSTM 和全连接 LSTM 有什么区别?

人工智能 深度学习 比较 循环神经网络 长短期记忆
2021-11-05 00:22:03

我目前正在尝试了解 vanilla LSTM 和完全连接的 LSTM 之间的区别。我正在阅读的一篇论文中,FC-LSTM 被介绍为

FC-LSTM 可以看作是 LSTM 的多元版本,其中输入、单元输出和状态都是一维向量

但实际上并没有进一步扩展。谷歌在这方面也没有给我太多帮助,因为我似乎在那个关键字下找不到任何东西。

两者有什么区别?另外,我对引用有点困惑——香草 LSTM 的输入、输出等不是已经是一维向量了吗?

1个回答

根据 ConvLSTM 论文中的引用,我得出的结论是,当他们说完全连接的 LSTM 时,它们指的是 Peephole LSTM。在他们采用编码器-解码器-预测器模型的论文中,他们指的是完全连接的 LSTM,使用了 Peephole LSTM。他们还从这篇论文中获取了完全连接的 LSTM 定义,该论文再次使用了 Peephole LSTM。

不同之处在于增加了“窥视孔连接”,它可以让门层查看单元状态并访问恒定错误轮播。