与神经网络相比,使用具有固定时间步长的 RNN 有什么优势?

数据挖掘 lstm rnn
2022-02-21 02:02:14

通常情况下,我看到 RNN 被用于固定长度的时间步长。那么下面这两个网络有什么区别呢?

  1. 序列 X t上时间步长为 3 的 RNN
  2. NN 输入 x (t-2) , x (t-1) , x (t)

他们在每一轮都得到 3 个时间步长的序列。因此,(我知道我错了,但是)这两个网络具有相同的能力。他们都使用前 3 个样本来预测下一个样本。那有什么区别呢?

2个回答

确实,他们都使用 3 个样本来预测下一个样本。但不同之处显然在于他们是如何学习的。深度神经网络将处理时间分布的样本,例如它们一次是单个样本。然而,RNN 将通过其顺序性将其学习为一个序列,一部分一部分。

(单向)RNN 的每个激活层将获取序列的一部分,进行预测并将该部分的预测转发给下一个激活层,该激活层将序列的下一部分作为输入。重要的部分是预测是前馈的,因此下一个神经元学习序列的下一部分也将受到前一个神经元的预测以及输入序列的影响,这与经典神经网络不同。当您查看下面的视觉示例时,它会很容易理解:

在此处输入图像描述

希望我能帮上忙。

直觉上,RNN 比 MLP 有更多的假设并增加了更多的约束,因此应该更有效但也更有限。MLP 可以完成与 RNN 相同的任务。你可以阅读这篇文章