我想对具有超过 50,000 个变量的模型使用 Lasso 或岭回归。我想使用 R 中的软件包来执行此操作。如何估计收缩参数()?
编辑:
这是我要达到的目的:
set.seed (123)
Y <- runif (1000)
Xv <- sample(c(1,0), size= 1000*1000, replace = T)
X <- matrix(Xv, nrow = 1000, ncol = 1000)
mydf <- data.frame(Y, X)
require(MASS)
lm.ridge(Y ~ ., mydf)
plot(lm.ridge(Y ~ ., mydf,
lambda = seq(0,0.1,0.001)))
我的问题是:我怎么知道哪个最适合我的模型?