由于我在工作中遇到的创建 k 折叠但折叠长度不相等的交叉验证策略,我试图辨别的一个小点有点困惑(例如,一些折叠大小为 17,另外 18 个,最多 24 个)。k-folds 交叉验证是否仅限于等长的折叠?训练数据长度和折叠次数的任意选择当然可以产生分数,其中一次折叠会拉短棒,但是说 k 折叠尝试做出大致相等的折叠大小是否准确?
特别是我在这个问题中听到了相互矛盾的信息
马特克劳斯“分为不同的、相互排斥的‘折叠’ ”
数据头“k-fold cross-validation (kFCV) 将 N 个数据点划分为 k 个 大小相等的互斥子集。”