问题: 我想确定一件事,使用时间序列的k-fold交叉验证是简单的,还是在使用之前需要特别注意?
背景: 我正在建模一个 6 年的时间序列(使用半马尔可夫链),每 5 分钟有一个数据样本。为了比较几个模型,我使用 6 折交叉验证,将 6 年的数据分开,所以我的训练集(用于计算参数)的长度为 5 年,测试集的长度为 1年。我没有考虑时间顺序,所以我的不同设置是:
- 折叠 1:训练 [1 2 3 4 5],测试 [6]
- 折叠 2:训练 [1 2 3 4 6],测试 [5]
- 折叠 3:训练 [1 2 3 5 6],测试 [4]
- 折叠 4:训练 [1 2 4 5 6],测试 [3]
- 折叠 5:训练 [1 3 4 5 6],测试 [2]
- fold 6:训练 [2 3 4 5 6],测试 [1]。
我假设每年都是相互独立的。我该如何验证呢?是否有任何参考资料显示 k 折交叉验证与时间序列的适用性。