单尾假设检验的证明

机器算法验证 假设检验
2022-01-27 16:40:32

我理解双尾假设检验。你有(与)。值是生成的数据至少与观察到的数据一样极端的概率。H0:θ=θ0H1=¬H0:θθ0pθ

我不明白单尾假设检验。这里,(相对于)。p 值的定义不应该从上面改变:它应该仍然是生成数据的概率,至少与观察到的一样极端。但我们不知道,只知道它的上限是H0:θθ0H1=¬H0:θ>θ0θ θθ0

因此,相反,我看到文本告诉我们假设(不是根据)并计算生成数据的概率至少与观察到的一样极端,但仅在一端. 从技术上讲,这似乎与假设无关。θ=θ0θθ0H0

现在,我知道这是常客假设检验,常客没有在他们的上放置先验。但这不应该仅仅意味着假设是不可能接受或拒绝的,而不是把上面的计算强加到图片中吗?θ

4个回答

这是一个深思熟虑的问题。许多文本(可能出于教学原因)都讨论了这个问题。真正发生的事情是H0是您单方面情况下的复合“假设”:它实际上是一组假设,而不是单个假设。有必要对每一个可能的假设 H0,测试统计量落在临界区域的机会必须小于或等于测试大小。此外,如果测试实际上是要达到其标称大小(这对于实现高功率是一件好事),那么这些机会的上限(接管所有零假设)应该等于标称大小。在实践中,对于涉及某些“好的”分布族的简单的单参数位置测试,对于具有参数的假设,可以达到这个上确率θ0. 因此,实际上,所有计算都集中在这一分布上。 但我们不能忘记该系列的其余部分H0:这是双面测试和单面测试之间的关键区别(以及一般的“简单”和“复合”测试之间)。

这会微妙地影响对单边测试结果的解释。当空值被拒绝时,我们可以说反对真实自然状态的证据是H0. 当 null 没有被拒绝时,我们只能说存在一个分布H0这与观察到的数据“一致”。我们并不是所有的分布H0与数据一致:远非如此!其中许多可能产生极低的可能性。

我看到p-值作为 I 类错误的最大概率。如果θθ0,I 类错误率的概率实际上可能为零,但就这样吧。从极小极大的角度来看测试时,对手永远不会从零假设的“内部”深处汲取灵感,而且力量也不应该受到影响。对于简单的情况(t-test,例如)可以构造一个具有保证的最大 I 类速率的测试,允许这样的单边零假设。

如果只有一个方向的结果支持您试图得出的结论,您将使用单边假设检验。

根据您提出的问题来考虑这一点。例如,假设您想查看肥胖是否会增加心脏病发作的风险。您收集的数据可能包括 10 个肥胖者和 10 个非肥胖者。现在假设由于未记录的混杂因素、糟糕的实验设计或只是运气不佳,您观察到 10 名肥胖者中只有 2 名心脏病发作,而非肥胖者中有 8 名。

现在,如果您要对这些数据进行双向假设检验,您会得出结论,肥胖与心脏病发作风险之间存在统计学上显着的关联 (p ~ 0.02)。但是,该关联将与您实际期望看到的方向相反,因此测试结果会产生误导。

(在现实生活中,产生这种违反直觉的结果的实验​​可能会导致更多本身有趣的问题:例如,数据收集过程可能需要改进,或者可能存在以前未知的风险因素在起作用,或者也许传统智慧完全是错误的。但这些问题与使用哪种假设检验的狭隘问题并不真正相关。)

p-value 是相应事件在以下条件下的概率H0是真的最简单的玩具示例是掷两次硬币。2面H0会是你认为硬币公平,即你扔一个头和一个尾巴。的概率是0.5.H1在这种情况下,您认为它偏向一侧或另一侧,即您要么抛出两个正面,要么抛出两个反面。概率又是0.5

对于一个 1 面H0想一想你把钱放在正面的游戏。你可以接受硬币是公平的,但当然也可以接受它偏向正面。这是你的H0你有一个头和一个尾或两个头的可能性:0.75可能性。H1只是剩下的两个尾巴的情况,你会称之为犯规:0.25可能性。请注意,因为您认为从公平到偏向正面的整个区域作为您的默认两条尾巴,所以被认为更不可能,甚至更暗示某些事情不按顺序排列。

现在当我们的事件H1然而,它们的概率是在相应条件下的 p 值H0是真的- 如上所述。因此,根据您的信心水平,您可以或不能拒绝您的H0的。

您可以自己在 R 中试验这个玩具示例,您还应该尝试不同的绝对数以及正面和反面的组合:

> binom.test(2,2,alternative="two.sided")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.5
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.1581139 1.0000000
sample estimates:
probability of success 
                     1

> binom.test(2,2,alternative="greater")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.25
alternative hypothesis: true probability of success is greater than 0.5
95 percent confidence interval:
 0.2236068 1.0000000
sample estimates:
probability of success 
                     1