我想知道 bootstrap CI(和 barticular 中的 BCa)如何在正态分布的数据上执行。似乎有很多工作检查它们在各种类型的分布上的表现,但在正态分布的数据上找不到任何东西。由于首先学习似乎是一件显而易见的事情,我想这些论文太旧了。
我使用 R 引导包进行了一些蒙特卡罗模拟,发现引导 CI 与精确 CI 一致,尽管对于小样本(N<20)它们往往有点自由(更小的 CI)。对于足够大的样本,它们本质上是相同的。
这让我想知道是否有充分的理由不总是使用自举。鉴于评估分布是否正常的困难,以及这背后的许多陷阱,不考虑分布而决定和报告引导 CI 似乎是合理的。我理解不系统地使用非参数测试的动机,因为它们的能力较小,但我的模拟告诉我,引导 CI 并非如此。它们甚至更小。
困扰我的一个类似问题是为什么不总是使用中位数作为集中趋势的度量。人们经常建议用它来表征非正态分布的数据,但既然中位数与正态分布数据的均值相同,为什么要区分呢?如果我们可以摆脱决定分布是否正常的程序,这似乎是非常有益的。
我很好奇您对这些问题的看法,以及之前是否讨论过这些问题。参考将不胜感激。
谢谢!
皮埃尔