LSTM 使用 one-hot 编码预测期望值和标准差

数据挖掘 预测建模 预言 lstm
2022-02-25 07:55:49

我正在将 LSTM 用于时间序列预测,这需要预测期望值(即预测的平均值)和标准偏差(即未来值应该落入的区间)。

我已经考虑过 one-hot encoding 可以返回每个类别的预测的可能性,然后可以用来找到预测的均值和 SD,例如,如果 LSTM 的输出是

  • 类别 | 可能性
  • [0,5) | 0.1
  • [5,10) | 0.2
  • [10,15) | 0.4
  • [15,20) | 0.3

然后我得出结论,预测的期望值为 (2.5x0.1 + 7.5x0.2 + 12.5x0.4 + 17.5x0.3 = 12)

并且以类似的方式找到SD。

我的问题是,这种方法是否是找到预测的均值和 SD 的有效方法,为什么/为什么不呢?

2个回答

分类变量的标准差和均值没有意义。看起来原始数据来自 [0, 20) 的范围,并且空间已经离散化。现在,您对类别 1 到 4 进行了排序,而不是范围。每个类别中的各个数字都失去了意义。有关更多详细信息,请参阅此处接受的答案

期望值和标准偏差是“独立的”,因为知道一个不会给您关于另一个的额外信息。因此,训练两个独立的网络更准确、更简单——一个用于期望值,一个用于标准差。

这还有一个优点,即您需要明确“(异方差)时间序列的标准差”的含义。