我想知道为什么 RNN 的目标值中的序列批处理会循环回来(我不确定你怎么称呼它),但让我们举个例子:
我们想学习从 1 到 16 的数字序列(我们的输入):
批次:2,序列长度:4
首先,我们可以将数据分成 2 个批次:
然后我们可以把它分成小批量:
然后我们需要为输入创建目标,直观地我们希望目标成为输入的下一个值,所以:
但是,这不是我通常看到的,而是我看到一个小批量中的最后一个值与第一个值交换:
那么这样做的直觉是什么?
因为如果我们要学习 1、2、3、4 的序列,但是将 1 作为值 3 的目标,所以没有学习 4,而是学习了 1。