数据挖掘 - 过拟合仅取决于验证损失还是训练和验证损失？ - 吾爱随笔录

数据挖掘训练过拟合验证

2022-03-05 04:03:49

训练和验证时可能会出现几种情况：

我知道过度拟合发生在场景 3 中，但是过度拟合发生在场景 1 中吗？如果是这样，这是否意味着只有在场景 1 或场景 3 发生时才会发生过度拟合？否则，如果过度拟合只发生在场景 3 中，这是否意味着只有在验证损失增加时才会发生过度拟合？

1个回答

在我看来，只有案例 3 应该被认为是过度拟合。正如@stans 所提到的，过度拟合没有一个非常严格的定义，因此其他人可能会有不同的想法。

我不会说验证损失停止减少的点是偏差和方差最小化的地方，因为偏差和方差之间存在权衡：

验证损失开始增加的点可以被认为是平方偏差和方差之和的最佳值，即泛化误差的最佳值。

其它你可能感兴趣的问题