我遇到了这个特定于 Keras 的答案。但我的问题是在概念层面。我很困惑,RNN如何处理可变大小的输入? 这里
假设我们想做一个情感分类
不同长度的训练批次:我认为这意味着批次中的所有训练示例必须具有相同的长度,但不同的批次可以具有可变长度的训练示例。
现在,假设训练示例的长度
- 批次 1 = 10,
- 批次 2 = 15。
现在在训练 batch-1 时,RNN 展开,下图中将有 10 列来处理序列 10 的输入。共享权重W、U、V维度必须与序列长度同步。我的意思是共享权重是w1,w2,..w10。直到这一部分我才明白。
现在,在处理序列长度为 15 的batch-2时,展开的 RNN 必须采用长度为 15 的序列。这意味着下图中有 15 列。
权重的数量从 10(w1,w2,...w10) 变为 15(w1,w2,..w15)。对我来说,这里的事情没有加起来。
共享权重会发生什么?他们是如何学习的?
