数据挖掘 - 训练数据：预测的还是实际的？ - 吾爱随笔录 - 问答

训练数据：预测的还是实际的？

数据挖掘时间序列训练机器学习模型预测

2022-03-04 22:26:48

我正在研究时间序列预测问题。我正在使用 keras 模型进行机器学习。

对于此预测，天气变量用作输入。它们可以有两种类型：预测的和实际的。我已经在相当长的时间内获得了这两种类型的数据，我想在数据上训练和测试我的模型。我的问题是：

1）我应该在训练时在输入中使用预测天气变量还是实际天气变量？（考虑在模型推断时只有预测的天气变量可用）。

2）相同的问题1进行测试。

关于上述问题是否有规则或一般做法？如果是，我想知道这一点。

1个回答

根据我的说法，对于模型训练，我们应该始终使用实际数据，以便您的预测始终接近现实。

但如果我也有预测数据，

我将使用预测数据训练另一个模型。

分析两个模型的结果。

确定两个结果之间的偏差。

将在未来预测中用作阈值（变化）。

其它你可能感兴趣的问题

上一篇图像锐化是数据增强的好主意吗？下一篇预测回归或分类中的离散值问题