在我的同事中,我注意到一种奇怪的坚持,即使用 70% 或 80% 的数据进行训练并验证其余数据。我对它感到好奇的原因是缺乏任何理论推理,而且它带有五重交叉验证习惯的影响。
在训练期间尝试检测过拟合时,是否有任何理由选择更大的训练集?换句话说,为什么不使用用于培训和验证影响是否真的来自我在这个答案中建议的线性建模理论的交叉验证实践?
我在 stats.stackexchange.com 上发布了一个类似的问题,但根据回复认为我可能会在这里进行更有趣的讨论。在我看来,多时期训练的概念本质上是贝叶斯的,因此交叉验证的概念在最坏的情况下可能是不合适的,在最好的情况下是不必要的,原因我在那篇文章中提出了建议。