假设我的训练损失为 0.5,验证损失为 2.5(两者都停止下降,验证损失从未增加)。我显然过度拟合。如果我添加正则化,我的训练损失变为 1,验证损失为 3.5。
第一个模型显然具有更好的验证损失,而第二个模型过拟合更少。
应该选择哪种型号?是否有可能过度拟合的模型在看不见的数据上表现更好,或者这是否意味着存在某种数据泄漏?
这里的问题是我没有做像图像分类这样简单的事情,而是尝试更复杂的事情,而且我没有找到很多关于过度拟合尚未解决的问题的资源。主要是对二值图像分类的讨论,在其中可以找到获得非常好的验证错误的模型,因此这些解释不适用于我的问题。
