我试图了解 Marcos Lopez de Prado 的“金融机器学习进展”一书(第 163 页)中描述的时间序列数据的“组合清除交叉验证”技术。
该设置被描述为研究人员想要测试“一些的回测路径”。我不太确定这意味着什么,但这是我目前所拥有的:
- 一个时间序列被分成个顺序组
- 选择数字进行交叉验证
- 一个组合方程用于计算“路径数”:
对于组和的情况,有路径,书中的图 12.1 将它们排列为表格。“train/test CV split”的数量为15(6选2),索引为下表中的列。行是6组,里面的数字是从1到5的路径id。
该书指出,“路径 2 是结合来自 (G1,S2)、(G2,S6)、(G3,S6)、(G4,S7)、(G5,S8) 和 (G6,S9) 的预测的结果。 " 通过G组的时间流逝,我可以看到。我没有关注的是拆分与组的关系。
人们显然对这本书评价很高。这是某人解释组合清除交叉验证的视频,但它没有回答我的问题。谁能告诉我这里发生了什么?这真的是对前向交叉验证的进步吗?