我正在尝试训练 LSTM 以便将其用于预测。该问题基本上是一个多元多步时间序列问题。
这只是一个实验,可以查看统计模型(ARIMA、Holts-Winters 等)和神经网络如何针对给定问题进行比较。
由于我的数据集非常适合统计模型,因此在尝试对其进行格式化以训练 LSTM 时遇到了麻烦,因为我在一个时间步长上有多个条目(对应于不同的实体)并且我真的不知道如何处理它因为序列不再受观察时间限制。假设我的数据集如下例所示:
time | ent | obs
1 --- 1 ------ 5
2 --- 1 ------ 6
2 --- 5 ------ 1
3 --- 2 ------ 7
3 --- 5 ------ 4
如您所见,并非每个实体在任何给定时间都有一个条目,一个时间步长可以有多个条目。
我想为每个实体训练 LSTM,但对于大多数实体来说,我的数据太少了。一些线程给了我将每个实体分成批次的想法,但观察的数量不是恒定的,所以它对我不起作用。
你认为我应该如何解决这个问题?