机器算法验证 - 具有多个随机效应的引导 - 吾爱随笔录

考虑一个有个主题和单词的实验。每个受试者对每个单词进行评分，产生一个数据矩阵。我有兴趣在周围形成一个置信区间，其中是一些任意标量函数。我希望这个置信区间考虑来自随机选择主题的抽样误差和来自随机选择单词的抽样误差。 $m$ $n$ $(m \times n)$ $\hat{X}$ $f(\hat{X})$ $f$

我倾向于做的是引导主题和单词：在每次引导迭代中，随机重新采样单词（有替换）和相同的主题（对所有重新采样的主题使用相同的重新采样单词集）。这会生成一个重新采样的数据矩阵和一个引导估计。然后使用引导估计的向量（例如，其中的 10,000 个）来形成引导置信区间（例如，百分位引导），就好像这些估计是标准的单因素引导估计一样。 $X^\ast_i$ $f(X^\ast_i)$

这是合法的还是我违反了引导程序的一些隐含假设？
有没有更原则的方法来处理这个问题？
是否有任何 R 包可以实现这样的过程？我可以轻松编写重采样代码，但计算高级引导间隔（例如，BCa）并非易事。boot似乎假设一个单一的随机效应。