我是否正确指定了我的 lmer 模型?

机器算法验证 r 混合模式 lme4-nlme
2022-03-29 10:10:55

我搜索了谷歌和这个网站,但我仍然对 lme4 库中的 lmer 函数感到困惑。

我从不同的精神病病房收集了一些数据,这些病房具有多层次的结构。为简化起见,我将选择两个 2 级变量和两个 1 级变量,尽管我实际上还有更多变量。

2 级 - WardSize [这是病房的人数] & WAS [这是衡量病房有多“好”的指标]

告诉 R 谁在哪个病房中的分组变量称为“病房”

一级 - 性别 [这显然是性别] 和 BSITotal [这是衡量症状严重程度的指标]

结果是自我拒绝,这又是它听起来的样子。

我有这个公式:

help=lmer(公式=Selfreject~WardSize+WAS+Gender+BSITotal+(1|Ward))

我希望这意味着“每个人都有与他们自己的性别和症状严重程度相关的分数,以及与病房大小和病房“好”程度相关的病房水平效应”

它是否正确?令我困惑的是,除了最后给出的病房级别截距外,我看不出 R 是如何分辨哪些是 1 级变量和哪些是 2 级变量。

如果有人能解释这个符号,让像我这样的白痴能理解,那就更好了。

非常感谢!

2个回答

你的型号规格很好。

与 (1 | Ward) 一样,在 lmer 中指定的 Ward 的不同截距表示每个病房内的受试者可能由于 WardSize 或 Gender 以外的原因在 Selfreject 上彼此更相似,因此您正在控制病房间异质性。

您可以将“1”视为适合截距的数据中的一列 1(即常数)。例如,通常在 lm 中自动隐含“1”

lm(Y ~ X1 + X2)

实际上指定

lm(Y ~ 1 + X1 + X2)

现在您已经有了基本模型,您可以开始提出进一步的问题,例如“BSItotal 和 Selfreject之间的关系在不同病房之间是否有所不同?”

lmer(formula=Selfreject ~ WardSize + WAS + Gender + BSITotal + (1 + BSITotal | Ward))

也就是说,BSITotal 的截距和斜率在病房之间可能不同。

如果您还没有阅读它,Gelman & Hill 的使用回归和多级模型/分层模型的数据分析是一本很棒的书,它解释了使用 lmer 拟合此类模型。

这是Douglas Bates(编写 lme4)解释为什么不需要为固定效果指定级别的链接。