有人可以给我一个例子,说明 ridge 何时会执行套索吗?
在大多数情况下套索不会做得更好吗?如果一个回归器的系数很大,这意味着该回归器是一个很好的预测器,所以如果我们使用岭,我们会更多地惩罚这个系数。那不是很糟糕吗?Lasso 将更多地惩罚较小的系数而减少较大的系数,因为 ridge 平方损失函数中的系数(L2 范数),而 lasso 只是 L1 范数。
我们想要更少的系数来防止过度拟合,那么套索不是总是更好吗?
如果有 2 个好的回归器和 15 个坏的回归器,Lasso 显然会更好,是否有一个典型的例子说明 ridge 何时会优于 lasso?