一对零假设和备择假设总是互补的吗?如果不是,它们通常何时不互补?
一对零假设和备择假设总是互补的吗?
我也一直有同样的问题。让我感到困惑的是,在很多地方我看到和不是互补的,例如, : = 0, : < 0,而不是 : >= 0, : < 0,
经过一些搜索后,我目前的理解是和应该是互补的,以使假设检验起作用(否则,不是 H_0 的唯一替代方案拒绝并不意味着我们可以接受)。但是我们只需要在原假设取等号的假设下计算检验统计量(在前面的例子中,即当 = 0时)。
你可以参考这个讲义。同时,下面是我用一个例子来澄清我的观点。
举例说明
假设我们要测试一枚硬币是否偏向正面,那么应该是“正面概率,大于 0.5”。由于这是一个单方面的测试,因此应该是“头部概率,小于或等于 0.5”。在数学表达式中:
下一步是:
- 假设为真。
为真,例如 x,选取并计算测试统计量。
- 检验统计量是 100 次投掷中的正面数。
计算检验统计量至少与 x 一样极端的概率。
- 在这种情况下,“极端”仅表示太大的值,因为零假设假设硬币不太可能出现正面。
当为真时,这意味着可以是 0.5、0.49、0.3 或任何小于/等于 0.5 的值。如果是这样的话,那是不是意味着我们应该计算的不是一个而是多个测试统计量?我的理解是肯定的。然而,我们真的不需要计算所有的测试统计数据来确定什么是极端的。我们可以通过用几个不同的参数绘制密度曲线来说明它。
df.l1.e1 =
data.frame(x1=1:100,
d1=dbinom(1:100, 100, prob = 0.5),
d2=dbinom(1:100, 100, prob = 0.45),
d3=dbinom(1:100, 100, prob = 0.4),
d4=dbinom(1:100, 100, prob = 0.35),
d5=dbinom(1:100, 100, prob = 0.3)) %>%
gather(key = "scenario", value = "density", -x1)
p1 = ggplot(df.l1.e1, aes(x1, density, color = scenario)) +
geom_line() + geom_point() +
geom_vline(xintercept = qbinom(1-0.05,100,0.5))
p1
5 条不同的曲线代表二项分布的 5 种不同的密度函数。它们具有相同的样本量(100),但成功的概率不同。垂直线显示了d1场景的临界值(在本例中为58) 。这意味着在 d1 情景下,正面出现 58 次或更多次(即至少与 58 次一样极端)的概率为 5%。
随着变小,密度函数越来越向左移动。这意味着场景、d2、d3 等的临界值将小于 58。换句话说,58 被认为是所有这些场景的极端事件。现在我们可以看到,如果检验统计量为 58 或更大,那么无论取什么值,只要它小于/等于 0.5,检验结果都将是一个极端事件。
例如,如果测试统计量是 57,那么我们不能拒绝,因为虽然在 d2, d3... 场景下结果是极端的,但在 d1 场景下却不是极端的。因此,我们不能拒绝。
所以根据我目前的理解,和对于单边检验应该是互补的,但我们只需要在原假设取等号的假设下计算检验统计量。