为二项式检验设置零假设

机器算法验证 二项分布
2022-04-04 05:19:26

我有一个在二项式检验中设置零假设的问题。更具体地说,有没有办法在未知的情况下假设机会水平?

例如,假设我有一个稍微弯曲的硬币。因此,获得正面或反面的机会并不相等。相反,它更有可能给我们带来尾巴。为了找出概率,我抛了 100 次硬币,得到 P(getting tail) = 68%

然后我把它弯得更大了,我想检查一下它是否对概率有任何影响。所以我扔了 10 次,反了 9 次(90%)。

使用一个样本二项式检验来检查 10 个中有 9 个(90%)是否使用 68% 作为预期概率显着不同是否正确?

我不确定这是否可以,因为它“假设”根据投掷硬币 100 次的经验,而不是数学计算,机会水平为 68%。

谢谢阅读。

3个回答

不,这是不正确的。在此示例中,您有两个样本,因此您应该使用两样本假设检验。有几种不同的两样本二项式检验可用,因此您需要选择一种。

使用一个样本二项式检验来检查 10 个中有 9 个(90%)是否使用 68% 作为预期概率显着不同是否正确?

我认为这是不正确的,因为您会假设 68% 是在没有不确定性的情况下测量的。直观地说,从 10000 次翻转中获得的 68% 是“更好的”,比仅从 100 次翻转中获得的 68% 更确定。

在您的情况下,您可以对 68/100 和 9/10 可以来自同一枚硬币的零假设使用 Fisher 检验。在 R 中:

mat <- matrix(c(68, 9, 100-68, 10-9), nrow= 2)
mat
     [,1] [,2]
[1,]   68   32
[2,]    9    1
fisher.test(mat)

    Fisher's Exact Test for Count Data

data:  mat
p-value = 0.2765
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
 0.005230503 1.851113305
sample estimates:
odds ratio 
 0.2384069 
```

不,您处理 100 (p^=68/100)作为样本统计量而不是总体比例。如果你重复那个试验100在第二次弯曲之前,你很可能不会得到68第二次尝试;你会看到65或者74或者70或者63,或其他一些数字,第三次试验可能会再次与前两次不同。

也就是说0.68只是对真实比例的嘈杂估计。你不应该忽视这种不确定性,把它当作真实的比例来对待。