此问题中提到的问题在 R 包 glmnet 的 1.7.3 版本中已修复。
我在使用 family=multinomial 运行 glmnet 时遇到了一些问题,并且想知道是否遇到过类似的事情,或者可能能够告诉我我做错了什么。
当我放入自己的虚拟数据时,运行时会报告错误“应用错误(nz,1,中位数):dim(X)必须具有正长度” cv.glmnet
,除了说“它不起作用”之外对我来说信息量不大。
y=rep(1:3,20) #=> 60 element vector
set.seed(1011)
x=matrix(y+rnorm(20*3*10,sd=0.4),nrow=60) # 60*10 element matrix
glm = glmnet(x,y,family="multinomial") #=> returns without error
crossval = cv.glmnet(x,y,family="multinomial") #=> Error in apply(nz, 1, median) : dim(X) must have a positive length
crossval = cv.glmnet(x,y,family="multinomial",type.measure="class") #=> Error in apply(nz, 1, median) : dim(X) must have a positive length
crossval = cv.glmnet(x,y,family="multinomial",type.measure="mae") #=> Error in apply(nz, 1, median) : dim(X) must have a positive length
cvglm = cv.glmnet(x,y,family="multinomial",lambda=2) #=> Error in apply(nz, 1, median) : dim(X) must have a positive length
这是我试图让 glmnet 解决的问题的视觉描述,如果有帮助的话:
my_colours = c('red','green','blue')
plot(x[,1],x[,2],col=my_colours[y])
我能够从包文档中运行示例代码,这让我怀疑我要么误解了某些东西,要么是 glmnet 中存在错误。
library(glmnet)
set.seed(10101)
n=1000;p=30
x=matrix(rnorm(n*p),n,p) #=> 1000*30 element matrix
beta3=matrix(rnorm(30),10,3)
beta3=rbind(beta3,matrix(0,p-10,3))
f3=x%*% beta3
p3=exp(f3)
p3=p3/apply(p3,1,sum)
g3=rmult(p3) #=> 1000 element vector
set.seed(10101)
cvfit=cv.glmnet(x,g3,family="multinomial")
这是使用 R 版本 2.13.1 (2011-07-08) 和 glmnet 1.7.1,尽管我可以在 R 2.14.1 上产生相同的问题。任何想法的人?