我有一个关于滑动窗口验证的广泛问题。具体来说,我正在考虑使用 Rapid Miner 使用该系列的“滞后”值和其他协变量来预测金融系列的未来值。我一直在用这个软件中的窗口运算符进行试验,并滞后值以准备建模。我感到困惑,并怀疑这是一个一般过程,而不仅仅是以 Rapid Miner 为中心的东西,因此我在这里问它,是滑动窗口训练/评估过程。
有没有人推荐学习滑动窗口过程以在时间序列上构建数据挖掘模型的资源?
特别是在构建模型时,我想我理解 k 个实例用于训练模型(例如 SVM),并且该模型的性能是通过预测接下来的 m 个记录来确定的。然后,窗口向前滑动一些量,接下来的 k 个记录用于训练,并对后续的 m 个记录进行评估。这一直持续到数据结束。
我的理解正确吗?
如何构建最终模型以用于未来数据?它是否总是在最后 k 条记录上重新训练,而这些最后 k 条记录仅用于创建最终模型?