这两条曲线有什么区别:learning_curve和validation_curve?
learning_curve 和 validation_curve 之间的区别
数据挖掘
机器学习
scikit-学习
评估
2021-10-15 10:00:46
1个回答
两条曲线都在y轴上显示了估计器的训练和验证分数。
学习曲线绘制不同数量的训练样本的分数,而验证曲线绘制不同超参数的分数。
学习曲线是一种工具,用于确定估计器是否会从更多数据中受益,或者模型是否过于简单(有偏见)。
上面的示例显示了分类器的训练曲线,其中训练和验证分数收敛到一个较低的值。这个分类器几乎不会从添加更多的训练数据中受益;更具表现力的模型可能更合适。
验证曲线是寻找良好超参数设置的工具。一些超参数(神经网络中的神经元数量、决策树中的最大树深度、正则化量等)控制模型的复杂性。我们希望模型足够复杂以捕获训练数据中的相关信息,但又不能太复杂以避免过度拟合。
上面的示例显示了支持向量机的 gamma 参数上的验证曲线。太低的 gamma 值会过多地限制模型;训练和验证分数都非常低。高 gamma 值会导致过度拟合:非常好的训练分数但低验证分数。最佳值位于中间的某个位置,曲线不会偏离太多。
图片来源:scikit-learn 文档
其它你可能感兴趣的问题