这种引导有名称吗?

机器算法验证 混合模式 引导程序
2022-03-18 08:55:43

考虑一个有多个人类参与者的实验,每个参与者在两种条件下进行多次测量。混合效果模型可以表述为(使用lme4语法):

fit = lmer(
    formula = measure ~ (1|participant) + condition
)

现在,假设我想为这个模型的预测生成自举置信区间。我想我已经想出了一种简单且计算效率高的方法,而且我确信我不是第一个想到它的人,但是我很难找到任何描述这种方法的先前出版物。这里是:

  1. 拟合模型(如上),称之为“原始模型”
  2. 从原始模型中获得预测,称之为“原始预测”
  3. 从与每个参与者的每个响应相关联的原始模型中获取残差
  4. 对残差重新采样,对参与者进行替换
  5. 将具有高斯误差的线性混合效应模型拟合到残差,称之为“临时模型”
  6. 计算每个条件的临时模型的预测(这些预测将非常接近于零),将这些称为“临时预测”
  7. 将临时预测添加到原始预测中,将结果称为“重新采样预测”
  8. 多次重复第 4 步到第 7 步,为每个条件生成重采样预测分布,从中可以计算一次 CI。

我在简单回归(即不是混合模型)的上下文中看到了“残差引导”程序,其中残差作为重采样单位进行采样,然后在每次迭代拟合新模型之前添加到原始模型的预测中引导程序,但这似乎与我描述的方法有很大不同,其中残差永远不会重新采样,人们是,并且只有获得临时模型,原始模型预测是否发挥作用。最后一个特性有一个非常好的附带好处,即无论原始模型的复杂性如何,临时模型始终可以拟合为高斯线性混合模型,在某些情况下可以显着加快。例如,我最近有二项式数据和 3 个预测变量,我怀疑其中一个会导致强烈的非线性效应,因此我不得不使用使用二项式链接函数的广义加性混合建模。在这种情况下拟合原始模型需要一个多小时,而在每次迭代中拟合高斯 LMM 只需几秒钟。

如果它已经是一个已知的程序,我真的不想要求优先权,所以如果有人能提供有关之前可能已经描述过的信息,我将非常感激。(另外,如果这种方法有任何明显的问题,请告诉我!)

1个回答

我的书 Bootstrap Methods 2n​​d Edition 有一个到 2007 年的大量参考书目。因此,即使我没有在书中涵盖该主题,参考文献也可能在参考书目中。当然,使用正确的关键词进行谷歌搜索可能会更好。Freedman、Peters 和 Navidi 在线性回归和计量经济学模型中进行了自举预测,但我不确定在混合模型案例中做了什么。Stine 1985 年的 JASA 论文 Bootstrap 回归预测区间如果您还没有看过的话,您会发现它非常有趣。