让我们称我们的数据集拆分为训练/测试/评估。我们处于需要数月数据的情况。因此,我们更愿意尽可能不频繁地使用评估数据集,以避免污染我们的结果。相反,我们进行 10 倍交叉验证 (CV) 来估计模型的泛化程度。
我们正在训练每个需要 24-48 小时的深度学习模型,而在执行 10 倍交叉验证时,参数扫描的过程显然非常缓慢。
有没有人有任何经验或引用来说明对数据的一部分进行参数扫描以及交叉验证(用于估计它的泛化程度)的效果如何?
我怀疑它高度依赖于数据的分布以及超参数的局部最小值和最大值,但我想问一下。