具有多个随机效应的引导

机器算法验证 混合模式 引导程序 交叉随机效应
2022-04-17 04:19:01

考虑一个有个主题和单词的实验。每个受试者对每个单词进行评分,产生一个数据矩阵我有兴趣在周围形成一个置信区间,其中是一些任意标量函数。我希望这个置信区间考虑来自随机选择主题的抽样误差和来自随机选择单词的抽样误差。mn(m×n)X^f(X^)f

我倾向于做的是引导主题和单词:在每次引导迭代中,随机重新采样单词(有替换)和相同的主题(对所有重新采样的主题使用相同的重新采样单词集)。这会生成一个重新采样的数据矩阵和一个引导估计然后使用引导估计的向量(例如,其中的 10,000 个)来形成引导置信区间(例如,百分位引导),就好像这些估计是标准的单因素引导估计一样。Xif(Xi)

  1. 这是合法的还是我违反了引导程序的一些隐含假设?
  2. 有没有更原则的方法来处理这个问题?
  3. 是否有任何 R 包可以实现这样的过程?我可以轻松编写重采样代码,但计算高级引导间隔(例如,BCa)并非易事。boot似乎假设一个单一的随机效应。
1个回答

我认为在这种情况下,建议进行参数引导:混合效应模型为您提供单词和主题效应方差的估计,因此您可以生成新的随机偏离它们的分布(因此无需实际重新采样估计的值)。自己写代码并不难,但是如果你使用lme4包来估计模型,那么我认为你应该可以通过函数来​​完成bootMer如果我正确理解您的问题,您可以编写一个包装函数,从引导模型并将其传递给. 一旦你有了Xf(X)bootMerf(X)您可以使用任何方法来计算置信区间(例如百分位数)。如果您对 BCa 间隔感兴趣,我有一些代码可以在这里计算(它是一个小包的一部分,其中包含我经常使用的自定义函数