我了解 lambda 在弹性网络回归中的作用。而且我可以理解为什么要选择 lambda.min,即最小化交叉验证错误的 lambda 值。
我的问题是在统计文献中建议在哪里使用 lambda.1se,即最小化 CV 误差加上一个标准误差的 lambda 值?我似乎找不到正式的引用,甚至找不到为什么这通常是一个很好的价值的原因。我知道这是一种限制性更强的正则化,并且会将参数更趋近于零,但我并不总是确定 lambda.1se 在什么条件下是比 lambda.min 更好的选择。有人可以帮忙解释一下吗?