这更像是一个概念性问题,但当我使用时,R
我将参考R
. 如果目标是为了预测的目的拟合线性模型,然后在随机效应可能不可用的情况下进行预测,那么使用混合效应模型有什么好处,还是应该使用固定效应模型?
例如,如果我有关于体重与身高的数据以及其他一些信息,并使用 构建以下模型lme4
,其中主题是与水平():
mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)
然后我希望能够使用新的身高和年龄数据从模型中预测体重。显然,模型中捕获了原始数据中的个体差异,但是否可以在预测中使用这些信息?假设我有一些新的身高和年龄数据,并且想预测体重,我可以这样做:
predict(mod1,newdata=newdf) # newdf columns for height, age, subject
这将使用predict.merMod
,我可以在newdf
或 set中包含(新)主题的列re.form =~0
。在第一种情况下,尚不清楚模型对“新”主题因素做了什么,在第二种情况下,模型中捕获的按主题方差是否会被简单地忽略(平均)以进行预测?
在任何一种情况下,在我看来,固定效应线性模型可能更合适。事实上,如果我的理解是正确的,那么如果预测中没有使用随机效应,那么固定效应模型应该预测与混合模型相同的值。应该是这样吗?它不是,R
例如:
mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)
predict(mod1,newdata=newdf, re.form=~0) # newdf columns for height, age, subject
产生不同的结果:
mod2 <- lm(weight ~ height + age, data=df)
predict(mod2,newdata=newdf) # newdf columns for height, age