我有三组数据,每组都有一个二项分布(即每组都有成功或失败的元素)。我没有预测的成功概率,而是只能依靠每个成功率作为真实成功率的近似值。我只发现了这个问题,它很接近,但似乎并不能完全处理这种情况。
为了简化测试,假设我有 2 个组(可以从这个基本案例扩展 3 个)。
团体 | 试验 | 成功 | 百分比 |
---|---|---|---|
第 1 组 | 2455 | 1556 | 63.4% |
第 2 组 | 2730 | 1671 | 61.2% |
我没有预期的成功概率,只有我从样本中知道的。
每个样本的成功率都相当接近。但是我的样本量也很大。如果我检查二项分布的 CDF 以查看它与第一个分布有多大不同(我假设第一个是空测试),我得到第二个可以实现的概率非常小。
在 Excel 中:
1-BINOM.DIST(1556,2455,61.2%,TRUE) = 0.012
但是,这没有考虑第一个结果的任何方差,它只是假设第一个结果是测试概率。
有没有更好的方法来测试这两个数据样本是否实际上在统计上彼此不同?