由于缺乏更好的术语,这里的过度拟合意味着训练和验证分数之间的差异较大,而非过度拟合意味着差异较小。
这个“困境”刚刚出现在我最近研究的神经网络模型中。我用 10 倍交叉验证训练了网络,得到了过度拟合的模型(0.118 分差):
- 0.967的训练集准确率和
- 0.849用于验证集。
然后,我在每个隐藏层之后应用了 dropout 层,dropout 率为 0.3,得到了“较少过度拟合”的模型(0.057 分差):
- 0.875的训练集准确率和
- 0.818用于验证集
这应该是好的,因为具有较低的差异,因此对于未知数据具有更好的可靠性。问题是,它的验证集得分较低。我不知情的直觉告诉我,无论你的模型多么过度拟合,验证集分数都很重要,因为它表明你的模型对新数据的了解程度,所以我选择了第一个模型。
这是正确的直觉吗?这种情况怎么办?