在处理复杂的最大混合模型(估计给定数据和模型的所有可能的随机效应)时,并不罕见的情况是完美的(+1 或 -1)或在某些随机效应之间几乎完美的相关性。为了讨论的目的,让我们观察以下模型和模型摘要
Model: Y ~ X*Cond + (X*Cond|subj)
# Y = logit variable
# X = continuous variable
# Condition = values A and B, dummy coded; the design is repeated
# so all participants go through both Conditions
# subject = random effects for different subjects
Random effects:
Groups Name Variance Std.Dev. Corr
subject (Intercept) 0.85052 0.9222
X 0.08427 0.2903 -1.00
CondB 0.54367 0.7373 -0.37 0.37
X:CondB 0.14812 0.3849 0.26 -0.26 -0.56
Number of obs: 39401, groups: subject, 219
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.49686 0.06909 36.14 < 2e-16 ***
X -1.03854 0.03812 -27.24 < 2e-16 ***
CondB -0.19707 0.06382 -3.09 0.00202 **
X:CondB 0.22809 0.05356 4.26 2.06e-05 ***
这些完美相关性背后的假定原因是我们创建了一个模型,对于我们拥有的数据来说太复杂了。在这些情况下给出的常见建议是(例如,Matuschek 等人,2017 年;论文)将过度参数化的系数固定为 0,因为这种退化模型往往会降低功效。如果我们在简化模型中观察到固定效应的显着变化,我们应该接受那个;如果没有变化,那么接受原来的没有问题。
但是,假设我们不仅对 RE 控制的固定效应(随机效应)感兴趣,而且对 RE 结构感兴趣。在给定的情况下,理论上可以假设Intercept
和斜率X
具有非零负相关。几个问题如下:
在这种情况下该怎么办?我们是否应该报告完美的相关性并说我们的数据“不够好”来估计“真实”的相关性?还是我们应该报告 0 相关模型?或者我们是否应该尝试将其他相关性设置为 0,以希望“重要”的相关性不再完美?我不认为这里有任何 100% 正确的答案,我主要想听听您的意见。
如何编写将 2 个特定随机效应的相关性固定为 0 的代码,而不影响其他参数之间的相关性?