训练数据:预测的还是实际的?

数据挖掘 时间序列 训练 机器学习模型 预测
2022-03-04 22:26:48

我正在研究时间序列预测问题。我正在使用 keras 模型进行机器学习。

对于此预测,天气变量用作输入。它们可以有两种类型:预测的和实际的。我已经在相当长的时间内获得了这两种类型的数据,我想在数据上训练和测试我的模型。我的问题是:

1)我应该在训练时在输入中使用预测天气变量还是实际天气变量?(考虑在模型推断时只有预测的天气变量可用)。

2)相同的问题1进行测试。

关于上述问题是否有规则或一般做法?如果是,我想知道这一点。

1个回答

根据我的说法,对于模型训练,我们应该始终使用实际数据,以便您的预测始终接近现实。

但如果我也有预测数据,

  1. 我将使用预测数据训练另一个模型。
  2. 分析两个模型的结果。
  3. 确定两个结果之间的偏差。
  4. 将在未来预测中用作阈值(变化)。