在尝试深入研究有关如何运行混合模型分析以及使用 AIC 选择最佳模型的文献后,我感到不知所措。我不认为我的数据有那么复杂,但我正在寻找确认我所做的事情是正确的,然后建议如何进行。我不确定是否应该使用 lme 或 lmer,然后使用其中任何一个,如果我应该使用 REML 或 ML。
我有一个选择值,我想知道哪些协变量最能影响该值并允许进行预测。这是一些组成的示例数据和我正在使用的测试代码:
ID=as.character(rep(1:5,3))
season=c("s","w","w","s","s","s","s","w","w","w","s","w","s","w","w")
time=c("n","d","d","n","d","d","n","n","n","n","n","n","d","d","d")
repro=as.character(rep(1:3,5))
risk=runif(15, min=0, max=1.1)
comp1=rnorm(15, mean = 0, sd = 1)
mydata=data.frame(ID, season, time, repro, risk, comp1)
c1.mod1<-lmer(comp1~1+(1|ID),REML=T,data=mydata)
c1.mod2<-lmer(comp1~risk+(1|ID),REML=T,data=mydata)
c1.mod3<-lmer(comp1~season+(1|ID),REML=T,data=mydata)
c1.mod4<-lmer(comp1~repro+(1|ID),REML=T,data=mydata)
c1.mod5<-lmer(comp1~time+(1|ID),REML=T,data=mydata)
c1.mod6<-lmer(comp1~season+repro+time+(1|ID),REML=T,data=mydata)
c1.mod7<-lmer(comp1~risk+season+season*time+(1|ID),REML=T,data=mydata)
我有大约 19 个模型,可以使用各种组合和最多 2 种交互项来探索这些数据,但总是将 ID 作为随机效应,将 comp1 作为我的因变量。
- Q1。使用哪个?lme还是lmer?有关系吗?
在这两种情况下,我都可以选择使用 ML 或 REML——我得到截然不同的答案——使用 ML 和 AIC 我最终得到了 6 个模型,所有模型都具有相似的 AIC 值,模型组合根本没有意义,而 REML导致 2 个最有可能的模型是最好的。但是,在运行 REML 时,我不能再使用 anova。
- Q2。由于与 ANOVA 一起使用,使用 ML 而不是 REML 的主要原因是什么?这对我来说不是很清楚。
我仍然无法运行 stepAIC,或者我不知道缩小这 19 个模型的另一种方法。
- Q3。有没有办法在这一点上使用 stepAIC?