一尾和双尾测试的区别?

机器算法验证 假设检验
2022-03-16 04:48:34

在学习我的统计课程时,我试图了解单尾假设检验和双尾假设检验之间的区别。具体来说,为什么单尾检验拒绝空值,而双尾检验不拒绝?

一个例子:

一尾和双尾假设检验的区别

3个回答

双尾测试测试任一方向的差异。因此,P 值将是 t=1.92 右侧的 t 分布下的面积加上 t=-1.92 左侧的分布下的面积。这是单尾检验面积的两倍,因此 P 值是两倍大。

如果您使用单尾检验,您将获得力量,但潜在的代价是必须忽略与获得数据之前假设相反的差异。如果您在正式化并记录假设之前获得了数据,那么您确实应该使用双尾检验。同样,如果您对任一方向的效果感兴趣,您可以使用双尾检验。事实上,您可能希望使用双尾检验作为默认方法,并且仅在效应只能在一个方向上存在的异常情况下使用单尾检验。

对于双尾检验,曲线下面积不是两倍大:对于临界 p= .05 的双尾检验,您正在测试从零分布的下限或上限 2.5% 中提取观察数据的频率 ( 0.05 总)。使用 1-tailed 测试,您正在测试数据来自一个(预先指定的)尾部的极端 5% 尾部的频率。

您的问题的部分答案是实践之一:大多数研究人员认为报告 1 尾测试的实验不太可能复制(即,他们假设研究人员选择这个是为了让他们的统计数据“显着”)。

然而,有有效的用例。如果您知道在所测试的理论下不可能有任何相反方向的结果,那么,正如之前的评论所指出的,您可以提前指定这一点并进行 1 尾测试。同样,大多数人仍然会谨慎地看待这一点。

差异的原因是“隐藏”在用于每个测试的测试统计中。请注意,对于假设检验,您选择一个统计量(即数据的函数)作为检验的基础。将此统计量称为您还需要一个拒绝区域,这样如果统计量在该区域内,我们就会拒绝空值。现在,显着性水平被计算为当 null 为真时统计量在拒绝区域中的概率。S(D)RR

现在对于两侧测试,测试统计量是带有拒绝区域,其中以实现显着性,在您的情况下为 5%。对于单面测试,测试统计量为,拒绝区域为,适合选择的现在我们将始终拥有所以为了达到同样的意义,我们必须有S(D)=|t||t|>t0t0αS(D)=tt>t1t1Pr(|t|>t0|H0)Pr(t>t0|H0)t0t1

这就引出了一个问题:为什么要使用不同的测试统计数据?原因是备选方案不同,因此每个检验统计量的功效不同。具体来说,如果我们使用来自另一个测试的测试统计量和拒绝区域,则每个测试的功效都会降低(假设我们使用相同的显着性)。