一对零假设和备择假设总是互补的吗?

机器算法验证 假设检验
2022-04-09 11:56:44

一对零假设和备择假设总是互补的吗?如果不是,它们通常何时不互补?

1个回答

我也一直有同样的问题。让我感到困惑的是,在很多地方我看到不是互补的,例如, : = 0, : < 0,而不是 : >= 0, : < 0,H0HaH0μHaμH0μHaμ

经过一些搜索后,我目前的理解是应该是互补的,以使假设检验起作用(否则,不是 H_0 的唯一替代方案拒绝并不意味着我们可以接受)。但是我们只需要在原假设取等号的假设下计算检验统计量(在前面的例子中,即当 = 0时)。H0Ha HaH0H0Haμ

你可以参考这个讲义同时,下面是我用一个例子来澄清我的观点。


举例说明

假设我们要测试一枚硬币是否偏向正面,那么应该是“正面概率,大于 0.5”。由于这是一个单方面的测试,因此应该是“头部概率,小于或等于 0.5”。在数学表达式中:HaθH0θ

H0:θ<=0.5Ha:θ>0.5

下一步是:

  1. 假设为真。H0
  2. 为真,例如 x,选取并计算测试统计量。H0

    • 检验统计量是 100 次投掷中的正面数。
  3. 计算检验统计量至少与 x 一样极端的概率。

    • 在这种情况下,“极端”仅表示太大的值,因为零假设假设硬币不太可能出现正面。

为真时,这意味着可以是 0.5、0.49、0.3 或任何小于/等于 0.5 的值。如果是这样的话,那是不是意味着我们应该计算的不是一个而是多个测试统计量?我的理解是肯定的然而,我们真的不需要计算所有的测试统计数据来确定什么是极端的。我们可以通过用几个不同的参数绘制密度曲线来说明它。H0θ

df.l1.e1 = 
  data.frame(x1=1:100,
             d1=dbinom(1:100, 100, prob = 0.5),
             d2=dbinom(1:100, 100, prob = 0.45),
             d3=dbinom(1:100, 100, prob = 0.4),
             d4=dbinom(1:100, 100, prob = 0.35),
             d5=dbinom(1:100, 100, prob = 0.3)) %>%
  gather(key = "scenario", value = "density", -x1)

p1 = ggplot(df.l1.e1, aes(x1, density, color = scenario)) + 
  geom_line() + geom_point() +
  geom_vline(xintercept = qbinom(1-0.05,100,0.5))

p1

密度曲线

5 条不同的曲线代表二项分布的 5 种不同的密度函数。它们具有相同的样本量(100),但成功的概率不同。垂直线显示了d1场景的临界值(在本例中为58) 。这意味着在 d1 情景下,正面出现 58 次或更多次(即至少与 58 次一样极端)的概率为 5%。

随着变小,密度函数越来越向左移动。这意味着场景、d2、d3 等的临界值将小于 58。换句话说,58 被认为是所有这些场景的极端事件现在我们可以看到,如果检验统计量为 58 或更大,那么无论取什么值,只要它小于/等于 0.5,检验结果都将是一个极端事件。θθ

例如,如果测试统计量是 57,那么我们不能拒绝,因为虽然在 d2, d3... 场景下结果是极端的,但在 d1 场景下却不是极端的。因此,我们不能拒绝H0H0

所以根据我目前的理解,对于单边检验应该是互补的,但我们只需要在原假设取等号的假设下计算检验统计量。H0Ha