就上下文而言,我进行了一项纵向研究,测量在饮食干预期间收集的人类粪便中细菌序列的计数。
最初,我将使用负二项式广义混合模型 (lme4::glmer.nb) 对每个细菌(序列)随时间的变化进行建模,并对受试者进行随机截距。然而,微生物组存在相当大的个体差异,我有很多案例,例如,11 名受试者有某种细菌存在时间趋势,但随后有 4 名受试者在整个研究中的计数为 0时期。我每个受试者有 6-10 个样本,所以这些受试者很可能根本没有那种细菌。
我已经使用零膨胀负二项式混合模型 (glmmTMB::glmmTMB) 对数据进行了建模,模型的条件部分和零膨胀部分的主题都是随机截距(并且只有固定效应的截距)零膨胀部分)。具体来说:
glmmTMB(sequence1 ~ time + (1|subject_id),
ziformula = ~ 1 + (1|subject_id),
family = "nbinom2",
data = data)
包括零通胀的随机效应显着改善了模型拟合。
在估计负二项式分量时,这种零膨胀模型是否有效地去除了从未检测到细菌的受试者?这种类型的模型与简单地丢弃从未检测到细菌的受试者并运行非零膨胀模型有何不同?