这里的假设情况,因为像引导这样的技术对于非常小的数据集通常会失败。
尽管如此,还是以自举为例。我们可以很容易地计算可能的引导(重新)样本的数量。
@whuber 在这里给出了一个很好的答案:
假设一下,自举对于低样本量是完全有效的。现在,假设我们有。从上面发布的解决方案中,发现总共可以绘制 126 个可能的 boostrap 重采样。
在引导过程中,我们通常会进行大量复制(例如 10000 个)。对如此小的数据集进行如此多的复制(如上面的数据集)似乎很奇怪,因为重新采样将被计算多次。
问题:这真的重要吗?如果是。对推理有什么影响?