预测模型预测数据的移动平均版本是否可以接受?

数据挖掘 Python 喀拉斯 时间序列 lstm
2022-03-03 18:19:40

我正在开发一个降水预测模型的项目。

当我尝试预测原始数据时,模型(LSTM 神经网络)无法预测峰值。

这是原始数据的预测值: 在此处输入图像描述 所以,我决定执行

1)一种差分方法,我只是从当前值中减去过去的值。

2) 对来自步骤 1 的结果数据的移动平均法。

然后我尝试预测这个处理后的数据版本。

以下是平滑数据的预测值: 在此处输入图像描述

1)这种预测模型是否为院士所接受?

2)我应该尝试预测原始数据吗?

3)这些类型的预测模型(预测数据的平滑版本)有什么可能的用途?

4)关于如何处理这种情况的任何建议?

2个回答

在估计理论中,估计随机变量的最简单方法是预测其实现的平均值。很容易,很简单,也很天真有用。

让我再解释一下:在您的天气问题中,前几天和第二天的数据之间的相关性非常高,这使您的估计很好,但在许多问题中,前几天的数据之间的相关性天和第二天是小(股市)。你需要记住的另一件事是犯错的成本,意思是预测温度是最近几天的平均值(75),如果实际温度是 78,那么差异是 3 可能是如果最近几天的平均值为 10 且实际值为 10.5,则在库存中可接受。这个差值 0.5 可能是不可接受的。

这在数学上意味着什么?如果您估计中的可接受误差 << 则具有基于平均值的估计器的数据中的变化是不可接受的。

关于将数据从一个域转换到另一个域的问题,如果你有一个可以带你回到原始域的确定性映射函数就可以了。我们更喜欢一对一的映射

1,2)在分类和回归问题中,您不是在寻找正确输出的平均值,而是在尝试预测正确的输出!所以不,我不认为这是你想要做的。您正在考虑一个更简单的问题,其中预期的输出只是实际值的移动平均值。

3)我从来没有做过天气预报,但我想在某种程度上拥有这些信息并不是完全没用的。(尽管不正确!)

4)我不知道你对回归了解多少,但是:

  • 您是否将数据集拆分为训练集、验证集和测试集?
  • 您是否考虑过将 CNN 用于时间序列
  • 您对 train e 验证的准确性如何?你过拟合了吗?