据我所知,LSTM 的输入特征的维数几乎没有限制。它显然可以学习数据的顺序。
我的问题是 LSTM 本质上是否也将除特征向量之外的先前输出值作为下一个输出值的新特征元素?即如果我们有:
[t] -> [x1, ..., xn] [y_t]
[t+1] -> [x1, ..., xn] [y_(t+1)]
是否有必要像这样操作数据
[t] -> [x1, ..., xn, y_(t-1)] [y_t]
[t+1] -> [x1, ..., xn, y_t] [y_(t+1)]
或者 LSTM 已经在为我们处理这个问题了?