我一直在阅读有关 k-fold 验证的内容,我想确保我了解它是如何工作的。
我知道对于holdout方法,数据被分成三组,测试集仅用于最后评估模型的性能,而验证集用于调整超参数等。
在k-fold方法中,我们最后是否还保留一个测试集,只使用剩余数据进行训练和超参数调优,即我们将剩余数据分成k折,然后使用训练后的平均准确率每次折叠(或我们选择调整超参数的任何性能指标)?还是我们根本不使用单独的测试集,而只是将整个数据集分成 k 折(如果是这种情况,我假设我们只是将 k 折上的平均准确率视为我们的最终准确率)?