我通常处理在 2 个或更多条件下对多个个体进行多次测量的数据。我最近一直在玩混合效应建模来评估条件之间差异的证据,建模individual
为随机效应。为了可视化来自这种建模的预测的不确定性,我一直在使用引导程序,在引导程序的每次迭代中,个体和个体内条件内的观察都被替换采样,并计算出一个新的混合效应模型,从中预测获得。这适用于假设高斯误差的数据,但是当数据是二项式时,引导可能需要很长时间,因为每次迭代都必须计算一个相对计算密集的二项式混合效应模型。
我的一个想法是,我可以使用原始模型的残差,然后使用这些残差而不是 bootstrap 中的原始数据,这将允许我在 bootstrap 的每次迭代中计算高斯混合效应模型。将原始数据的二项式模型的原始预测添加到残差的自举预测中,原始预测的置信区间为 95%。
然而,我最近对这种方法进行了简单的评估,对两个条件之间没有差异进行建模,并计算 95% 置信区间不包括零的次数比例,我发现上述基于残差的引导程序产生了相当强的反保守间隔(它们排除零超过 5% 的时间)。此外,我随后对这种方法进行了类似的评估(与之前的链接相同),该评估适用于最初为高斯的数据,并且它获得了类似的(尽管不是极端的)反保守 CI。知道为什么会这样吗?