我想我独立地理解了这些概念(交叉验证、正则化)中的每一个,但我不太清楚如何在实践中将它们组合在一起。
粗略地说,在交叉验证中,我将在我的数据子集上训练我的模型,然后选择在数据的保留部分上表现最好的模型。在正则化中,我将试探性地选择某种正则化函数,然后尝试找到给出最佳结果我们可以使用交叉验证来选择吗?我认为每个不同的值都可以被视为产生一个新模型,但是我们不是有无限多的模型可供选择吗?
我想我独立地理解了这些概念(交叉验证、正则化)中的每一个,但我不太清楚如何在实践中将它们组合在一起。
粗略地说,在交叉验证中,我将在我的数据子集上训练我的模型,然后选择在数据的保留部分上表现最好的模型。在正则化中,我将试探性地选择某种正则化函数,然后尝试找到给出最佳结果我们可以使用交叉验证来选择吗?我认为每个不同的值都可以被视为产生一个新模型,但是我们不是有无限多的模型可供选择吗?
交叉验证正则化参数选择的过程如下:
(训练误差和测试误差)与(模型复杂性/容量)形成 U 形关系。在学习模型时,有两个目标:
(1) 是通过使用交叉验证来实现的 - 找到偏差和方差之间的精细平衡
(2) 是通过使用正则化来实现的 - 使测试误差 U 曲线更接近训练误差曲线。