为什么不总是使用引导 CI?

机器算法验证 置信区间 引导程序 正态假设 重采样
2022-03-02 23:14:18

我想知道 bootstrap CI(和 barticular 中的 BCa)如何在正态分布的数据上执行。似乎有很多工作检查它们在各种类型的分布上的表现,但在正态分布的数据上找不到任何东西。由于首先学习似乎是一件显而易见的事情,我想这些论文太旧了。

我使用 R 引导包进行了一些蒙特卡罗模拟,发现引导 CI 与精确 CI 一致,尽管对于小样本(N<20)它们往往有点自由(更小的 CI)。对于足够大的样本,它们本质上是相同的。

这让我想知道是否有充分的理由不总是使用自举。鉴于评估分布是否正常的困难,以及这背后的许多陷阱,不考虑分布而决定和报告引导 CI 似乎是合理的。我理解不系统地使用非参数测试的动机,因为它们的能力较小,但我的模拟告诉我,引导 CI 并非如此。它们甚至更小。

困扰我的一个类似问题是为什么不总是使用中位数作为集中趋势的度量。人们经常建议用它来表征非正态分布的数据,但既然中位数与正态分布数据的均值相同,为什么要区分呢?如果我们可以摆脱决定分布是否正常的程序,这似乎是非常有益的。

我很好奇您对这些问题的看法,以及之前是否讨论过这些问题。参考将不胜感激。

谢谢!

皮埃尔

1个回答

查看 BCa 间隔的动机及其机制(即所谓的“校正因子”)是有益的。BCa 区间是 bootstrap 最重要的方面之一,因为它们是 Bootstrap Percentile Intervals(即仅基于 bootstrap 分布本身的置信区间)的更一般情况。

具体来说,看看 BCa 区间和 Bootstrap Percentile Intervals 之间的关系:当加速度(第一个“校正因子”)和偏度(第二个“校正因子”)的调整都为零时,BCa 间隔恢复到典型的 Bootstrap 百分比区间。

我不认为总是使用引导程序是个好主意。Bootstrapping 是一种强大的技术,具有多种机制(例如:置信区间,并且对于不同类型的问题存在不同的 bootstrap 变化,例如存在异方差时的狂野 bootstrap),用于调整不同的问题(例如:非正态性),但它依赖于一个关键假设:数据准确地代表了真实的人口。

这个假设虽然本质上很简单,但很难验证,尤其是在小样本的情况下(尽管小样本可能是真实人口的准确反映!)。如果引导分布的原始样本(以及由此得出的所有结果)不够准确,那么您的结果(以及因此基于这些结果的决定)将是有缺陷的。

结论:引导程序存在很多歧义,在应用它之前应该谨慎行事。