数据挖掘 - 在整个数据上训练模型有意义吗？ - 吾爱随笔录

假设我在股票价格数据上训练一个 lstm 模型。

因此，对于第一次迭代，假设我已经在 80% 的数据上对其进行了训练，然后在其余 20% 的数据上对其进行了测试并获得了 rmse 值。

现在在这之后，在预测值之前再次训练整个数据是否有意义？

示例我有 2010 年到今天的 aapl 数据，我已经在 2010 年到 2020 年对其进行了训练，并从 2020 年到今天进行了测试并获得了 rmse 值。

现在在预测第二天的值之前，是否有必要在整个数据集上再次训练它，即从 2010 年到今天？

因为我观察到的是，在测试中，初始预测的误差比更远的预测要少，所以我想也许我应该在预测下一天或一周的值之前对整个数据集进行训练，因为我知道测试中模型的准确性较早的样品。

听起来不错还是有我不知道的缺点？