L2正则化增加深度学习模型的损失率

数据挖掘 深度学习 喀拉斯 张量流 卷积神经网络
2021-10-02 23:36:02

当我将 L2 正则化添加到我的深度学习模型中时,训练和验证损失率会增加。

为什么 ????

1个回答

假设一个具有规则损失函数的神经网络。

i=1NL(yi,y^i)

这里,yi是标签i-第一个例子,而y^i是模型对相同的预测。损失函数L是一个比较实际输出和预测输出并输出一个值的函数,该值指示预测与实际输出的接近程度。

L2 正则化为这个损失函数添加了一个范数惩罚,结果是每次权重更新。

i=1NL(yi,y^i)+λW22

这个惩罚抵消了实际的更新,这意味着它使权重更新更加困难。这实际上增加了损失函数的输出。

通过向模型添加正则化,您应该寻找的不是减少训练损失,而是减少验证损失这表明正则化成功地减少了模型的过度拟合,这是它的目标。