从这个套索图(glmnet)得出什么结论的问题演示了套索估计器的非单调解决方案路径。也就是说,一些系数在收缩之前会以绝对值增长。
我已经将这些模型应用于几种不同类型的数据集,并且从未在“野外”看到过这种行为,直到今天还假设它们总是单调的。
是否有一组明确的条件可以保证解决方案路径是单调的?如果路径改变方向,是否会影响结果的解释?
从这个套索图(glmnet)得出什么结论的问题演示了套索估计器的非单调解决方案路径。也就是说,一些系数在收缩之前会以绝对值增长。
我已经将这些模型应用于几种不同类型的数据集,并且从未在“野外”看到过这种行为,直到今天还假设它们总是单调的。
是否有一组明确的条件可以保证解决方案路径是单调的?如果路径改变方向,是否会影响结果的解释?
我可以给你一个路径是单调的充分条件:一个正交设计.
假设一个正交设计矩阵,即变量, 我们有. 使用正交设计,OLS 回归系数很简单.
LASSO 的 Karush-Khun-Tucker 条件因此简化为:
在哪里是子梯度。因此,对于每个我们有,并且我们对 lasso 估计有一个封闭形式的解决方案:
哪个是单调的. 虽然这不是必要条件,但我们看到非单调性必须来自协变量的相关性.