lme4 中 (factor|group) 和 (1|factor:group) 规范之间的差异

机器算法验证 r 混合模式 重复测量 lme4-nlme
2022-03-27 19:28:42

多年来,我对集群进行了重复测量,并且我预计集群效应每年都会有所不同。年份被编码为一个因素,“1”作为参考水平。我尝试了以下方法:

mod1 <- lmer(y ~ x + year + (year|cluster))

mod2 <- lmer(y ~ x + year + (1|cluster:year))

我的第一个示例指定了以下随机效应:

ranef(mod1)
$cluster
    (Intercept)  year2         year3        year4         year5
AA   0.03721015  0.0573160920 -0.114709171  0.1588302187  0.125329740
AB  -0.12958994 -0.0458997003  0.216455596  0.2345170893  0.248950509
AC  -5.10692972 -0.1311546328  1.130347798  2.5215580167  5.070106525
AD   0.10087455 -0.2677088515 -0.345583355 -0.2442831982 -0.257074662
....

第二条规定:

ranef(mod2)
$`cluster:year`
              (Intercept)
AA:year2  0.0838186244
AA:year3 -0.1197284361
AA:year4  0.1944488619
AA:year5  0.1562090690

我认为它们是等价的,因为年份是一个因素,但我一定不能很好地理解随机效应规范lme4谁能帮我理解这两种参数化之间的区别?

1个回答

乍一看,有两个主要区别:

  1. mod1 是一个随机截距随机斜率模型,而 mod2 是一个随机截距模型(没有随机斜率):(year|cluster)隐式包含截距,因此扩展为(1 + year|cluster). 在这种情况下,您假设每个集群都有不同的基线,并允许集群根据年份效应而变化。
  2. mod2 包括一个交互,而 mod1 不包括:由于 mod2 只包括集群*年交互的随机截距,您可以获得因子水平的每个唯一组合的估计值(即 AA:year2, AA:year3, ...)

请注意,mod1 估计个随机效应个方差和相关性。如果您将与集群相关的方差约束为相等并且所有相关性也相等(这称为复合对称性),您将获得一个具有更少(只有两个)方差/协方差参数的模型:kk(k1)/2k

mod3 <- lmer(y ~ x + year + (1|cluster) + (1|year:cluster))

注意与 mod2 相比的相似性/差异),当数据中没有足够的信息来估计 mod1 时,这可能很有用。有关这方面的更多信息,请参阅Reinhold Kliegl 的这篇出色的帖子以及我的后续问题:Equivalence of (0 + factor|group) and (1|group) + (1|group:factor) random effect Specifications in case of Compound Symmetry .

所以 mod3 可以看作是 mod1 的限制版本。您的 mod2 受到进一步限制,但这种单参数参数化可以说不太现实。