首先,bootstrap 无法解决原始样本不具代表性的问题。因此我同意@CliffAB。
随着样本量的增加,随机抽取一个没有代表性的样本的机会会减少。如果只有一次投掷硬币,结果将总是“瘫痪”:样本中完全不存在总体中的两个(头部、尾部)元素(头部或尾部)。同时,正如@justanotherbrain 在问题中指出的那样,10 次投掷硬币中有 10 次正面朝上的机会略低于10−3- 比你只有一次投掷要好得多。@whuber 正确地指出引导属性是渐近的。我要补充一点,在某些条件下,bootstrap 比标准估计器更有效,例如达到n3/2而不是n1/2. (我不会在这里展开这些条件;在 Hall "The Bootstrap and Edgeworth Expansion" (1992)(这是一整本书)中给出了详细的处理。)
但是,让我提供另一个视角,为什么 bootstrap 通常是相关的。抱歉,如果它没有直接解决您的问题。
Bootstrap 可用于评估估算器(公式)是否正常工作。思路如下。
- 考虑原始样本(的n元素)作为“人口”
- 画一个n来自原始样本的元素引导样本
- 将估计量(公式)应用于引导样本以获得其实现(一个值)
- 多次迭代2.和3.,保存每次迭代的实现
多次迭代的实现将形成一个经验分布。您可以访问它的特征(均值、方差等)。
由于您将原始样本视为“总体”,因此您知道该总体的真实特征。然后,您可以从第 5 点获取经验分布(基于许多 bootstrap 实现),并查看它相对于估计器应该估计的实际总体特征(一项)的外观。
因此,您可以了解您的估算器(一个公式)是否有偏差,其方差有多大等。在评估估算器的属性时,所有这些都是有价值的信息。更好的是,原始样本通常应该对实际感兴趣的人群具有相当的代表性(与您的示例相反)。因此,您可以将您的结论从引导实验扩展到感兴趣的原始问题(通过类比)。
例如,如果您发现估计者倾向于低估总体特征b单位 (b代表偏见),你会添加b以原始样本为基础进行估计,以消除偏差。这样一来,您将获得对您最初所追求的特征的无偏估计。因此,您将在引导时有效地利用您对估计器的了解。
但最后我必须重申,如您的示例所示,如果原始样本不具代表性,则引导程序不是一种补救措施。