考虑 lme 线性混合模型中的异方差性?

机器算法验证 r 异方差 混合模式 lme4-nlme
2022-03-25 06:34:26

我有一个数据集,我在其中测量了细胞中存在的分子数量 (M) 作为药物(有或没有)和治疗天数(5 个时间点)的函数。我重复了这个实验 3 次,每次都使用来自不同供体的细胞。我目前正在尝试比较组之间的平均值。但是,这些数据不是正常的和异方差的,我正在研究如何最好地处理这个问题。

转换数据使数据集正常,但异方差仍然存在。我是一个统计新手,但我过去几天的阅读表明线性混合模型应该能够处理这个问题。lme主要基于 Pinhiero/Bates 的书,我使用in拼凑了以下模型RvarPower除了声明之外,它们是相同的。

model1 <- lme(sqrt(M) ~ drug + Days + drug*Days, 
            random = ~ 1+drug+Days+drug*Days|Donor, data=D)

model2 <- lme(sqrt(M) ~ drug + Days + drug*Days,
            random = ~ 1+drug+Days+drug*Days|Donor, data=D, varPower(form = ~fitted(.)) )

当我使用 比较这两个模型anova()时,model2对数可能性显着增加。但是,当我检查针对拟合值或自变量绘制的标准化残差时,两个模型的图形具有相同的形状。请注意,残差的幅度略大,varPower()包括:

plot(model1, resid(., type="p") ~ fitted(.), abline=0)
plot(model1, resid(., type="p") ~ Days|drug, abline=0)

残差图

这些图之间的相似性是否意味着我未能充分考虑组之间的不等方差?

如果是这样,哪些方法可以产生足够的校正?此外,如果您对此处的适用性或模型的结构有任何一般性意见lme,也将受到欢迎!

2个回答

几点

  • 的使用varPower()似乎不正确。您需要将其传递weightslme().
  • 残差的形状表明您有一个有界的结果,在边界处或附近有许多值。相反,您可以考虑为有界结果使用 Beta 混合效应模型,或为半连续数据考虑混合模型。

考虑异方差可以为您提供有效的 SE。它不应该足以改变您的估计以实际消除异方差。

然而,这些图的异方差似乎是系统的(考虑到图下半部分的急剧下降边缘)。所以,我猜这是一个建模/数据问题,应该在尝试解决它之前解决。