数据挖掘 - LSTM 使用 one-hot 编码预测期望值和标准差 - 吾爱随笔录

数据挖掘预测建模预言 lstm

2022-02-25 07:55:49

我正在将 LSTM 用于时间序列预测，这需要预测期望值（即预测的平均值）和标准偏差（即未来值应该落入的区间）。

我已经考虑过 one-hot encoding 可以返回每个类别的预测的可能性，然后可以用来找到预测的均值和 SD，例如，如果 LSTM 的输出是

然后我得出结论，预测的期望值为 (2.5x0.1 + 7.5x0.2 + 12.5x0.4 + 17.5x0.3 = 12)

并且以类似的方式找到SD。

我的问题是，这种方法是否是找到预测的均值和 SD 的有效方法，为什么/为什么不呢？

2个回答

分类变量的标准差和均值没有意义。看起来原始数据来自 [0, 20) 的范围，并且空间已经离散化。现在，您对类别 1 到 4 进行了排序，而不是范围。每个类别中的各个数字都失去了意义。有关更多详细信息，请参阅此处接受的答案

期望值和标准偏差是“独立的”，因为知道一个不会给您关于另一个的额外信息。因此，训练两个独立的网络更准确、更简单——一个用于期望值，一个用于标准差。

这还有一个优点，即您需要明确“（异方差）时间序列的标准差”的含义。

其它你可能感兴趣的问题