我也被引导和贝叶斯定理所吸引,但在我从贝叶斯的角度来看之前,我无法理解引导的合理性。然后 - 正如我在下面解释的 - 引导分布可以被视为贝叶斯后验分布,这使得引导背后的(a?)基本原理显而易见,并且还具有澄清所做假设的优势。在https://arxiv.org/abs/1803.06214(第 22-26 页)中有更多关于以下论点和假设的详细信息。
例如,在http://woodm.myweb.port.ac.uk/SL/resample.xlsx的电子表格上设置(单击屏幕底部的引导选项卡),假设我们有9 个测量值的样本,平均值为 60。当我使用电子表格生成 1000 个重新采样并从该样本中替换并将平均值四舍五入到最接近的偶数时,这些平均值中有 82 个是 54。自举的想法是我们将样本用作“假装”总体,以查看 9 个样本的均值可能有多可变,因此这表明样本均值低于总体均值 6 的概率(在这种情况下,假装总体基于平均值为 60 的样本)为 8.2%。对于重采样直方图中的其他条,我们可以得出类似的结论。
现在让我们假设事实是真实总体的平均值是 66。如果是这样,我们对样本平均值为 60(即数据)的概率的估计是 8.2%(使用上面段落中的结论记住60 比假设的总体平均值 66 低 6)。让我们把它写成
P(数据给定平均值=66)= 8.2%
该概率对应于重采样分布上的 x 值为 54。同样的论点适用于从 0、2、4 ... 100 的每个可能的总体平均值。在每种情况下,概率都来自重采样分布 - 但这种分布反映了 60 的平均值。
现在让我们应用贝叶斯定理。所讨论的测量值只能取 0 到 100 之间的值,因此四舍五入到最接近的偶数,总体平均值的可能性为 0、2、4、6、...100。如果我们假设先验分布是平坦的,则这些中的每一个都有 2% 的先验概率(到 1 dp),贝叶斯定理告诉我们
P(PopMean=66 给定数据)= 8.2%*2%/P(数据)
在哪里
P(数据) = P(PopMean=0给定数据)*2%+ P(PopMean=2给定数据)*2% + ... + P(PopMean=100给定数据)*2%
我们现在可以取消 2% 并记住概率之和必须为 1,因为概率只是来自重采样分布的概率。这给我们的结论是
P(PopMean=66)=8.2%
请记住,8.2% 是对应于 54(而不是 66)的重采样分布的概率,后验分布只是反映样本均值(60)的重采样分布。此外,如果重采样分布在不对称是随机的意义上是对称的——就像在这种情况和许多其他情况下一样,我们可以将重采样分布视为与后验概率分布相同。
这个论点做出了各种假设,主要是先验分布是均匀的。这些在上面引用的文章中有更详细的说明。