数据挖掘 - RNN 中的序列批处理 - 吾爱随笔录

我想知道为什么 RNN 的目标值中的序列批处理会循环回来（我不确定你怎么称呼它），但让我们举个例子：

我们想学习从 1 到 16 的数字序列（我们的输入）：

[\begin{matrix} 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 & 9 & 10 & 11 & 12 & 13 & 14 & 15 & 16 \end{matrix}]

$\begin{bmatrix} 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 & 9 & 10 & 11 & 12 & 13 & 14 & 15 & 16 \end{bmatrix}$

批次：2，序列长度：4

首先，我们可以将数据分成 2 个批次：

[\begin{matrix} 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 \\ 9 & 10 & 11 & 12 & 13 & 14 & 15 & 16 \end{matrix}]

$\begin{bmatrix} 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8\\ 9 & 10 & 11 & 12 & 13 & 14 & 15 & 16 \end{bmatrix}$

然后我们可以把它分成小批量：

[\begin{matrix} 1 & 2 & 3 & 4 \\ 9 & 10 & 11 & 12 \end{matrix}]

$\begin{bmatrix} 1 & 2 & 3 & 4\\ 9 & 10 & 11 & 12 \end{bmatrix}$

[\begin{matrix} 5 & 6 & 7 & 8 \\ 13 & 14 & 15 & 16 \end{matrix}]

$\begin{bmatrix} 5 & 6 & 7 & 8\\ 13 & 14 & 15 & 16 \end{bmatrix}$

然后我们需要为输入创建目标，直观地我们希望目标成为输入的下一个值，所以：

[\begin{matrix} 2 & 3 & 4 & 5 \\ 10 & 11 & 12 & 13 \end{matrix}]

$\begin{bmatrix} 2 & 3 & 4 & 5\\ 10 & 11 & 12 & 13 \end{bmatrix}$

但是，这不是我通常看到的，而是我看到一个小批量中的最后一个值与第一个值交换：

[\begin{matrix} 2 & 3 & 4 & 1 \\ 10 & 11 & 12 & 9 \end{matrix}]

$\begin{bmatrix} 2 & 3 & 4 & 1\\ 10 & 11 & 12 & 9 \end{bmatrix}$

那么这样做的直觉是什么？

因为如果我们要学习 1、2、3、4 的序列，但是将 1 作为值 3 的目标，所以没有学习 4，而是学习了 1。