分类算法的学习曲线

数据挖掘 机器学习 分类 方差 偏见
2022-03-02 11:22:44

我试图理解分类问题的学习曲线。但我不确定要推断什么。我相信我有过度拟合,但我不能确定。

  1. 非常低的训练损失,在添加训练示例后会略微增加。
  2. “在添加训练示例时逐渐减少验证损失(没有展平)”。但是,我在行尾看不到任何间隙,这通常可以在过拟合模型中找到

另一方面,我可能有欠拟合:

  1. 欠拟合模型的学习曲线在开始时训练损失较低,随着训练样例的增加逐渐增加并保持平稳,这表明增加更多的训练样例并不能提高模型在未见数据上的性能
  2. 训练损失和验证损失最后接近

但是,训练误差并不大,通常在欠拟合模型上发现

我很困惑你能给我一些建议吗?

在此处输入图像描述

在此处输入图像描述

1个回答

由于您在描述中没有提到这一点,所以我首先强调这些图表显示了不同大小的训练集的性能,即这是消融研究的结果。这很重要,因为这意味着 X 轴上的每个点都代表一个不同的模型

现在,这两张图在图的左侧显示了明显的过度拟合:训练集的性能非常高,而测试/验证集的性能非常低。因此,所有用少于 450-500 个实例训练的模型都是过拟合的。但是两条曲线收敛到训练和验证性能相等的点,所以最后一个大约有 500 个实例的模型没有任何过度拟合的迹象。

欠拟合不太常见,也不太容易从这种曲线中检测到,但它的特点是即使在训练集上也表现不佳。这不会发生在这里,所以我认为这可以排除。训练集和测试集的性能相同的事实仅表明没有过度拟合,而不是模型欠拟合。