使用置换检验时,p 值周围的置信区间是什么意思?

机器算法验证 r 置信区间 p 值 置换检验
2022-03-25 17:55:25

我正在使用 R 中的 coin 包进行排列测试,它给出的输出如下所示:

> pvalue(pt)
[1] 0.1479615
99 percent confidence interval:
0.1450811 0.1508754 

为什么需要 p 值的置信区间?应该如何解读,如何使用?

2个回答

置换测试(和自举)的理论基于查看每个可能的置换的想法。如果您可以查看所有可能的排列,那么您就有了一个精确的 p 值。

在大多数情况下,计算每个可能的排列是不切实际的,因此我们从可能排列的“总体”中采样,并从这个“样本”中计算 p 值。因此,由于我们从总体中抽取样本,我们可以使用标准技术(在这种情况下为二项式比例)来计算真实 p 值的置信区间,我们将从每个可能的排列中计算出来。

如何使用此置信区间:如果 alpha 的值(您的显着性截止值或 I 类错误的概率)在区间内,那么您不确定是否要拒绝,因为不同的排列样本可能会给出不同的结果。这意味着您可能应该使用更多的排列重新运行分析,以获得对真实 p 值的更好估计。

如果整个区间与您的 alpha 值相去甚远,那么您可以确信拒绝或不拒绝原假设。有些人会将最接近 alpha 的置信区间的界限报告为保守的 p 值。如果您已经完成了大量排列,那么通常边界将足够接近,因此无论哪种方式都无关紧要。

纯粹常客解释:如果你要做这个实验N次,你应该期待X时间百分比(在您的情况下为 99%)或NX时代,那是真实的p值落在此 99% 置信区间提供的范围内,该百分比或次数。