是否可以接受替代假设?

机器算法验证 假设检验
2022-01-20 15:06:21

我知道这里有几个相关的问题(例如,围绕 null 的假设检验术语是否有可能证明零假设?)但我不知道下面我的问题的明确答案。

假设有一个假设检验,我们想检验一枚硬币是否公平。我们有两个假设:

H0:p(head)=0.5

H1:p(head)0.5

假设我们使用 5% 的显着性水平,有两种可能的情况:

  1. 当我们获得数据并发现 p 值小于 0.05 时,我们说“显着性水平为 5%,我们拒绝 ”。H0
  2. p 值大于 0.05,那么我们说“显着性水平为 5%,我们不能拒绝 ”。H0

我的问题是:

在情况 1 中,说“我们接受 ”是否正确?H1

直觉上,从我过去学到的东西来看,我觉得“接受”任何作为假设检验的结果总是不正确的。另一方面,在这种情况下,由于上的并集覆盖了整个“空间”,因此“拒绝 ”和“接受 ”在我看来完全一样。在另一个想法上,我也可以想到以下想法,它说“我们接受 ”是不正确的:H0H1H0H1H1

我们有足够有力的证据相信不是真的,但我们可能没有足够强大的证据相信是真的。因此,“拒绝 ”并不自动意味着“接受H0H1H0H1

那么,正确答案是什么?

2个回答

IMO(本身不是逻辑学家或受过正式培训的统计学家),人们不应该太认真地对待这种语言。即使在p < .001 时拒绝 null 也不会毫无疑问地使 null 为 false。那么,在类似的临时意义上“接受”替代假设有什么害处呢?在相反的情况下(即一个大的、微不足道的p),它比“接受零”更安全,因为替代假设的具体性要低得多。例如,给定,如果p = .06,未来的研究仍有 94% 的机会会发现至少与 null* 不同的效果,因此接受α=.05即使不能拒绝空值,空值也不是明智的选择。相反,如果p = .04,则可以拒绝 null,我一直认为这意味着支持替代方案。为什么不“接受”?我能看到的唯一原因是一个人可能是错的,但在拒绝时也是如此。

另一种选择并不是特别强烈的主张,因为正如您所说,它涵盖了整个“空间”。要拒绝您的空值,必须在空值的任一侧找到可靠的影响,以使置信区间不包括空值。给定这样的置信区间 (CI),备择假设是正确的:其中的所有值都不等于空值。备择假设对于 CI 之外的值也是正确的,但与 null 的差异比 CI 内最不同的值更大(例如,如果,它不会 ) ,对于备择假设来说,t 甚至是一个问题。如果你能得到这样的 CI,那么,有什么不能接受的呢,更不用说替代假设了?CI95%=[.6,.8]P(head)=.9

可能有一些我不知道的论点,但我怀疑我会被说服。务实地说,如果有评论者参与,最好不要写下你接受替代方案,因为与他们(与一般人一样)的成功通常取决于不以不受欢迎的方式违背期望。无论如何,如果您没有将“接受”或“拒绝”过于严格地视为事情的最终真相,那么风险并不大。我认为这是无论如何都要避免的更重要的错误。

同样重要的是要记住,即使它可能不真实,null 也很有用。在我提到的第一个例子中p = .06 时,不拒绝 null 并不等于认为它是真的,但它基本上与判断它在科学上有用是一样的。拒绝它与判断替代方案更有用基本相同。这对我来说似乎足够接近“接受”,特别是因为它不是一个可以接受的假设。

顺便说一句,这是关注 CI 的另一个论点:如果您可以使用 Neyman–Pearson 式推理拒绝空值,那么为了拒绝空值p小多少都没关系。级别拒绝 null可能更有用,而不是比您更自信地拒绝 null需要(一种统计上的“矫枉过正”)。如果您事先有一个舒适的错误率,请尝试使用该错误率来描述您认为效果大小可能在ααααCI(1α). 对于大多数目的,这可能比接受更模糊的替代假设更有用。


* 关于这个示例p值的解释的另一个重要点是,它代表了在给定 null 为真的情况下的这种机会。如果在这种情况下,证据似乎表明空值是不真实的(尽管对于传统的科学标准来说不够有说服力),那么这个机会就更大了。换句话说,即使 null 是真的(但人们不知道这一点),在这种情况下下注也不明智,如果下注是不真实的,那就更糟了!

假设通过多次投掷硬币你得到序列(head, tail, head, head, head)

你用假设检验真正计算出的实际上是ℙ[ obtaining (head, tail, head, head, head) | ℙ(head) = 0.5 ]

也就是说,您会得到以下问题的答案:

假设H0: ℙ(head) = 0.5,我(head, tail, head, head, head)至少有 5% 的时间得到序列吗?

所以这个问题的表述方式是你根本无法得到1. Is ℙ(head) ≠ 0.5 true?

这两种说法并不相互排斥。并不是因为一个命题被证明是错误的,另一个命题就必然是正确的。

因此,在情况 1 中,is it correct to say "we accept H1"?答案是否定的,您的结论是:

我们有足够有力的证据相信 H0 不是真的,但我们可能没有足够有力的证据相信 H1 是真的。因此,“拒绝 H0”并不自动意味着“接受 H1”

对我来说似乎是正确的。

科学理论只建立在一组特定的命题之上,直到其中一个命题被证明是错误的。沿着这些思路,假设检验的一般思想是通过现成的事实排除命题的直接矛盾,但它不提供证明。