解释零膨胀模型中的随机效应

机器算法验证 混合模式 负二项分布 零通胀 glmmtmb
2022-04-03 04:17:21

就上下文而言,我进行了一项纵向研究,测量在饮食干预期间收集的人类粪便中细菌序列的计数。

最初,我将使用负二项式广义混合模型 (lme4::glmer.nb) 对每个细菌(序列)随时间的变化进行建模,并对受试者进行随机截距。然而,微生物组存在相当大的个体差异,我有很多案例,例如,11 名受试者有某种细菌存在时间趋势,但随后有 4 名受试者在整个研究中的计数为 0时期。我每个受试者有 6-10 个样本,所以这些受试者很可能根本没有那种细菌。

我已经使用零膨胀负二项式混合模型 (glmmTMB::glmmTMB) 对数据进行了建模,模型的条件部分和零膨胀部分的主题都是随机截距(并且只有固定效应的截距)零膨胀部分)。具体来说:

glmmTMB(sequence1 ~ time + (1|subject_id), 
        ziformula = ~ 1 + (1|subject_id),
        family = "nbinom2",
        data = data)

包括零通胀的随机效应显着改善了模型拟合。

在估计负二项式分量时,这种零膨胀模型是否有效地去除了从未检测到细菌的受试者?这种类型的模型与简单地丢弃从未检测到细菌的受试者并运行非零膨胀模型有何不同?

1个回答

在估计负二项式分量时,这种零膨胀模型是否有效地去除了从未检测到细菌的受试者?

不,您编写的模型考虑了它们在零部分和条件部分中每个主题的相关性。换言之,同一受试者体内检测到或未检测到细菌的倾向比不同受试者更相似;对于那些确实检测到细菌的受试者,计数的数字在同一受试者中可能比不同受试者更相似。在这两种情况下,随机截距的变化都捕捉到了这些相关性。

这种类型的模型与简单地丢弃从未检测到细菌的受试者并运行非零膨胀模型有何不同?

在这种情况下,您只是对那些检测到细菌的受试者的计数进行建模,而忽略了可能的免疫力或无法检测到的感染水平(或任何零计数的原因)的问题。

另外,不要忘记负二项分布支持零。我们拟合了一个零膨胀模型,其中有多余的零。因此,仅出于这个原因,完全删除零可能不是一个好主意。