我试图弄清楚在以下情况下我应该使用什么测试:我知道在工作中的特定领域有很大的改进空间 - 非常关键,假设抽样观察,个可以改进。在制定了六个月的改进/质量保证计划后,让我假设在个案例的样本中,只有有残留缺陷。这两个样本是独立的。因此,我们比较了两个比例:和。
虽然数字被夸大了,但我仍然想看看这两个比例是否在统计上显着不同,我想我有两个选择:我可以运行一个精确的二项式检验来计算新的有缺陷观察比例的概率,,如果实际的潜在概率保持为 ,则会发生。或者,我可以运行卡方检验。
卡方是一个近似值,我读到的是当观察总数太高时应用它。示例中显然不是这种情况;但是,在使用 R 中的数字时,即使在使用数字之后,我也看不到任何延迟或结果问题。并且没有迹象表明正在使用任何正态近似值。
那么,如果这一切都是真的,为什么我们不应该总是选择精确的二项式检验,而不是卡方呢?
这两个测试在 R 中的代码是:
# Exact Binomial Test:
binom.test(c(11, 55 - 11), p = 31/52, alternative ="less")
#Chi-square Test:
prop.test(c(31, 11), c(52, 55), correct = FALSE, alternative = 'greater')