为什么从混合效应模型中引导残差会产生反保守的置信区间?

机器算法验证 置信区间 混合模式 引导程序 蒙特卡洛 模拟
2022-03-07 01:51:14

我通常处理在 2 个或更多条件下对多个个体进行多次测量的数据。我最近一直在玩混合效应建模来评估条件之间差异的证据,建模individual为随机效应。为了可视化来自这种建模的预测的不确定性,我一直在使用引导程序,在引导程序的每次迭代中,个体和个体内条件内的观察都被替换采样,并计算出一个新的混合效应模型,从中预测获得。这适用于假设高斯误差的数据,但是当数据是二项式时,引导可能需要很长时间,因为每次迭代都必须计算一个相对计算密集的二项式混合效应模型。

我的一个想法是,我可以使用原始模型的残差,然后使用这些残差而不是 bootstrap 中的原始数据,这将允许我在 bootstrap 的每次迭代中计算高斯混合效应模型。将原始数据的二项式模型的原始预测添加到残差的自举预测中,原始预测的置信区间为 95%。

然而,我最近这种方法进行了简单的评估,对两个条件之间没有差异进行建模,并计算 95% 置信区间不包括零的次数比例,我发现上述基于残差的引导程序产生了相当强的反保守间隔(它们排除零超过 5% 的时间)。此外,我随后对这种方法进行了类似的评估(与之前的链接相同),该评估适用于最初为高斯的数据,并且它获得了类似的(尽管不是极端的)反保守 CI。知道为什么会这样吗?

1个回答

请记住,所有引导置信区间仅在规定的置信水平上渐近。还有许多可能的方法来选择自举置信区间 Efron 百分位数法、Hall 百分位数法、双自举法、自举 t、倾斜自举法、BC、BCa 等等。您还没有告诉我们您使用哪种方法。Schenker 在 JASA 1985 上的论文表明,对于某些卡方分布,BC 引导置信区间低于广告的百分比。在小样本问题中,这个问题可能很严重。LaBudde 和我有两篇论文展示了在小样本中,当从对数正态分布估计方差时,即使 BCa 的覆盖率也很差,并且在测试两个方差的相等性时存在类似的问题。这只是一个简单的问题。我希望混合模型的残差也会发生同样的事情。在 Wiley 于 2011 年出版的新书“An Introduction to Bootstrap Methods with Applications to R”中,我们在第 3.7 节中讨论了这个主题并提供了参考。令人惊讶的是,当样本量较小时,百分位数方法有时比高阶准确 BCa 方法做得更好。