可以使用 bootstrap 代替非参数测试吗?

机器算法验证 非参数 引导程序
2022-01-19 12:21:06

我对统计相当陌生。引导的概念让我感到困惑。

我知道使用某些测试(例如 t 检验)需要抽样分布的正态性。在数据不是正态分布的情况下,通过在 SPSS 的 t 检验中请求“引导”,这会规避非正态性问题吗?如果是这样,输出中报告的 t 统计量是否基于自举抽样分布?

此外,在我有非正态数据的情况下,与使用 Mann-Whitney 或 Kruskal-Wallis 等非参数测试相比,这会是一个更好的测试吗?在数据不正常且我使用引导程序的情况下,我不会报告 t 统计量:对吗?

1个回答

bootstrap 无需像正态性这样的假设即可工作,但当样本量较小且总体不正常时,它可能会发生很大变化。因此,在假设成立的意义上,它可能会更好,但并不是在所有方面都更好。

带替换的引导样本,不带替换的置换测试样本。Mann-Whitney 和其他非参数检验实际上是置换检验的特例。我实际上更喜欢这里的置换检验,因为您可以指定一个有意义的检验统计量。

使用哪种测试的决定应基于所回答的问题和有关导致数据的科学的知识。中心极限定理告诉我们,即使总体不正常,我们仍然可以从 t 检验中获得非常好的近似值。近似值的好坏取决于总体分布(而不是样本)的形状和样本量。在许多情况下,对于较小的样本,t 检验仍然是合理的(在某些情况下,在非常大的样本中它不够好)。