分类算法的学习曲线
数据挖掘
机器学习
分类
方差
偏见
2022-03-02 11:22:44
1个回答
由于您在描述中没有提到这一点,所以我首先强调这些图表显示了不同大小的训练集的性能,即这是消融研究的结果。这很重要,因为这意味着 X 轴上的每个点都代表一个不同的模型。
现在,这两张图在图的左侧显示了明显的过度拟合:训练集的性能非常高,而测试/验证集的性能非常低。因此,所有用少于 450-500 个实例训练的模型都是过拟合的。但是两条曲线收敛到训练和验证性能相等的点,所以最后一个大约有 500 个实例的模型没有任何过度拟合的迹象。
欠拟合不太常见,也不太容易从这种曲线中检测到,但它的特点是即使在训练集上也表现不佳。这不会发生在这里,所以我认为这可以排除。训练集和测试集的性能相同的事实仅表明没有过度拟合,而不是模型欠拟合。
其它你可能感兴趣的问题