通过 bootstrap t 方法或简单地通过 bootstrap 估计平均值的置信区间?

机器算法验证 置信区间 引导程序
2022-03-24 16:28:18

在估计均值的置信区间时,我认为bootstrap t方法和非参数bootstrap方法都可以应用,但前者需要更多的计算。

我想知道 bootstrap t 相对于正常的非参数 bootstrap 的优缺点是什么?为什么?

是否有一些参考资料可以解释这一点?

1个回答

Bootstrap仍然依赖于参数分布的假设:如果统计量的自举分布具有正态分布,则可以使用 bootstrap-方法。这将导致对称 CI。tt

但是,如果抽样分布有偏差或有偏差,最好使用百分位自举法(允许非对称 CI)。

现在,您应该使用哪种方法?

关于 bootstrap 均值:根据 Wilcox (2010) 的模拟,百分位数 bootstrap应用于未修剪的均值(在这种情况下 bootstrap效果更好);从 20% 的微调开始,百分位引导程序优于引导程序 10% 的微调情况尚不清楚)。tt

另一个提示来自 Hesterberg 等人。(2005 年,第 14-35 页):

安全使用 bootstrap t 和 bootstrap 百分位区间的条件有点模糊。我们建议您通过相互比较来检查这些间隔是否合理。如果 bootstrap 分布的偏差较小且分布接近正态分布,则 bootstrap t 和百分置信区间将非常吻合。百分位区间与 t 区间不同,不会忽略偏度。因此,只要偏差很小,百分位区间通常更准确。因为我们很快就会遇到更准确的引导间隔,所以我们的建议是,当引导 t 和引导百分位数间隔不一致时,不应该使用任何类型的间隔。

--> 如果出现分歧,最好使用 BCa 校正的引导 CI!


Hesterberg, T., Monaghan, S., Moore, D., Clipson, A., & Epstein, R. (2005)。引导方法和置换测试。统计实践导论,14.1–14.70。

威尔科克斯,RR (2010)。现代统计方法的基础知识:大幅提高功效和准确性。施普林格出版社。