机器算法验证 - 测试两个二项分布是否在统计上彼此不同 - 吾爱随笔录

机器算法验证统计学意义二项分布伯努利分布

2022-01-21 03:54:43

我有三组数据，每组都有一个二项分布（即每组都有成功或失败的元素）。我没有预测的成功概率，而是只能依靠每个成功率作为真实成功率的近似值。我只发现了这个问题，它很接近，但似乎并不能完全处理这种情况。

为了简化测试，假设我有 2 个组（可以从这个基本案例扩展 3 个）。

团体	试验 $n_i$	成功 $k_i$	百分比 $p_i$
第 1 组	2455	1556	63.4%
第 2 组	2730	1671	61.2%

我没有预期的成功概率，只有我从样本中知道的。

每个样本的成功率都相当接近。但是我的样本量也很大。如果我检查二项分布的 CDF 以查看它与第一个分布有多大不同（我假设第一个是空测试），我得到第二个可以实现的概率非常小。

在 Excel 中：

1-BINOM.DIST(1556,2455,61.2%,TRUE) = 0.012

但是，这没有考虑第一个结果的任何方差，它只是假设第一个结果是测试概率。

有没有更好的方法来测试这两个数据样本是否实际上在统计上彼此不同？

4个回答

因此，您想针对给定的备选方案检验以下零假设

$H_0:p_1=p_2$ 相对 $H_A:p_1\neq p_2$

所以你只需要计算测试统计量

z = \frac{{\hat{p}}_{1} - {\hat{p}}_{2}}{\sqrt{\hat{p} (1 - \hat{p}) (\frac{1}{n_{1}} + \frac{1}{n_{2}})}}

$z=\frac{\hat p_1-\hat p_2}{\sqrt{\hat p(1-\hat p)\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}$

在哪里 $\hat p=\frac{n_1\hat p_1+n_2\hat p_2}{n_1+n_2}$ .

所以现在，在你的问题中， $\hat p_1=.634$ , $\hat p_2=.612$ , $n_1=2455$ 和 $n_2=2730.$

计算出检验统计量后，您只需计算相应的临界区值即可比较您的检验统计量。例如，如果您在 95% 的置信水平上检验这个假设，那么您需要将检验统计量的绝对值与临界区值进行比较 $z_{\alpha/2}=1.96$ （对于这两个尾测试）。

现在，如果 $|z|>z_{\alpha/2}$ 那么你可以拒绝原假设，否则你一定不能拒绝原假设。

好吧，此解决方案适用于您比较两组的情况，但它并不能推广到您想要比较 3 组的情况。

但是，您可以使用卡方检验来测试所有三个组是否具有相同的比例，正如@Eric 在上面的评论中所建议的那样：“这个问题有帮助吗？stats.stackexchange.com/questions/25299/ ... – Eric”

在 R 中，答案计算为：

fisher.test(rbind(c(1556,2455-1556), c(1671,2730-1671)), alternative="less")

只是一个总结：

Dan 和 Abaumann 的回答建议在二项式模型下进行测试，其中零假设是一个统一的单一二项式模型，其均值是根据经验数据估计的。他们的答案在理论上是正确的，但他们需要使用正态分布进行近似，因为检验统计量的分布并不完全遵循正态分布。因此，它仅适用于大样本量。

但大卫的答案是使用费舍尔检验指示非参数检验。信息在这里：https ://en.wikipedia.org/wiki/Fisher%27s_exact_test 它可以应用于小样本但难以计算大样本。

使用哪种测试以及您对 p 值的信任程度是一个谜。但无论选择哪种测试，总会有偏差。

你的测试统计是 $Z = \frac{\hat{p_1}-\hat{p_2}}{\sqrt{\hat{p}(1-\hat{p})(1/n_1+1/n_2)}}$ ，在哪里 $\hat{p}=\frac{n_1\hat{p_1}+n_2\hat{p_2}}{n_1+n_2}$ .

关键区域是 $Z > \Phi^{-1}(1-\alpha/2)$ 和 $Z<\Phi^{-1}(\alpha/2)$ 对于双尾测试，通常对单尾测试进行调整。

其它你可能感兴趣的问题