LASSO 回归是否在 Statsmodels 中实现?

数据挖掘 线性回归 正则化
2022-03-08 08:59:57

我很想在 statsmodels 中使用线性 LASSO 回归,以便能够使用“公式”表示法来编写模型,这将在处理许多分类变量及其交互时为我节省相当多的编码时间。但是,它似乎还没有在统计模型中实现?

3个回答

提问者直到现在才使用 scikit-learn,但 statsmodels 刚刚推出了 Lasso 回归的实现。这里的文档非常不言自明且简洁。

好的替代解决方案:我可以将 Patsy 与 scikit-learn 一起使用,以获得与使用 statsmodels 中的公式表示法获得的相同结果。请参见下面的代码:

from patsy import dmatrices

# create dummy variables, and their interactions
y, X = dmatrices('outcome ~ C(var1)*C(var2)', df, return_type="dataframe")
# flatten y into a 1-D array so scikit-learn can understand it
y = np.ravel(y)

我现在可以使用在 scikit-learn 中实现的任何模型,使用通常的符号,将 X 作为自变量,将 y 作为因变量。

http://statsmodels.sourceforge.net/stable/genindex.html

是索引页。“套索”在任何地方都找不到。

为什么不使用 sckit-learn?