机器算法验证 - 通过 bootstrap t 方法或简单地通过 bootstrap 估计平均值的置信区间？ - 吾爱随笔录

通过 bootstrap t 方法或简单地通过 bootstrap 估计平均值的置信区间？

机器算法验证置信区间引导程序

2022-03-24 16:28:18

在估计均值的置信区间时，我认为bootstrap t方法和非参数bootstrap方法都可以应用，但前者需要更多的计算。

我想知道 bootstrap t 相对于正常的非参数 bootstrap 的优缺点是什么？为什么？

是否有一些参考资料可以解释这一点？

1个回答

Bootstrap仍然依赖于参数分布的假设：如果统计量的自举分布具有正态分布，则可以使用 bootstrap-方法。这将导致对称 CI。 $t$ $t$

但是，如果抽样分布有偏差或有偏差，最好使用百分位自举法（允许非对称 CI）。

现在，您应该使用哪种方法？

关于 bootstrap 均值：根据 Wilcox (2010) 的模拟，百分位数 bootstrap不应用于未修剪的均值（在这种情况下 bootstrap效果更好）；从 20% 的微调开始，百分位引导程序优于引导程序 10% 的微调情况尚不清楚）。 $t$ $t$

另一个提示来自 Hesterberg 等人。（2005 年，第 14-35 页）：

安全使用 bootstrap t 和 bootstrap 百分位区间的条件有点模糊。我们建议您通过相互比较来检查这些间隔是否合理。如果 bootstrap 分布的偏差较小且分布接近正态分布，则 bootstrap t 和百分置信区间将非常吻合。百分位区间与 t 区间不同，不会忽略偏度。因此，只要偏差很小，百分位区间通常更准确。因为我们很快就会遇到更准确的引导间隔，所以我们的建议是，当引导 t 和引导百分位数间隔不一致时，不应该使用任何类型的间隔。

--> 如果出现分歧，最好使用 BCa 校正的引导 CI！

Hesterberg, T., Monaghan, S., Moore, D., Clipson, A., & Epstein, R. (2005)。引导方法和置换测试。统计实践导论，14.1–14.70。

威尔科克斯，RR (2010)。现代统计方法的基础知识：大幅提高功效和准确性。施普林格出版社。

其它你可能感兴趣的问题

上一篇是否可以指定没有任何固定效应的 lmer 模型？下一篇关于 ANOVA、t 检验和非参数检验的独立性假设的问题