样本量较小的一个总体比例假设的 z 检验

机器算法验证 t检验 小样本 z检验 精确检验
2022-04-15 02:25:36

我向一小群人(n = 22)提出了一个“是/否”的问题。22 人中,14 人回答“是”,8 人回答“否”。我想以 90% 的信心找出我的大多数人(> 50%)是否会对该问题回答“是”。

根据我的阅读,我会使用 z 检验来计算总体比例,尽管我的样本量太小而无法使用这种检验。我读过 t-tests should be used when the sample is small (ie n < 30), 尽管我无法找到总体比例的 t-tests 示例。

即使我的样本量很小,我是否应该执行 z 检验?我应该做一些其他类型的计算吗?

如果使用的术语不正确,或者我在问一些愚蠢的问题,我深表歉意。我的背景不是统计学,近十年来我没有做过任何统计。

谢谢!

1个回答

为了达到那种程度的自信,你必须满足最严格的批评者。他们会要求你建立

  1. 您的样本确实是一个简单的随机样本。

  2. 受访者诚实而正确地回答。

  3. 如果人口中最赤裸裸的少数人,即不到一半的人实际上会回答“是”,那么您将拥有不到10090%=10%在这样一个随机样本中至少观察到这么多肯定的机会。

你地址(1)通过解释和记录您识别人群并从中获取样本的程序。

你地址(2)通过记录提问是如何进行的,并包括额外的问题来评估可靠性和内部一致性。

你地址(3)通过计算观察机会14最多时随机样本中的一个或多个是50%如果被问到,人口的回答是肯定的。让我们这样做。

假设人口很大(任何大于几百都可以),yes 计数的分布将非常接近带有参数的二项式22p<50%. 在最坏的情况下,你必须处理,采取p=50%.

这是相关机会的部分图表。第一行是阈值计数;低于它是样本中的计数等于或超过它的机会。

Threshold:   11   12   13   14   15   16   17   18   19   20   21   22
   Chance: 0.58 0.42 0.26 0.14 0.07 0.03 0.01 0.00 0.00 0.00 0.00 0.00 

由于 14 或更多的机会是0.14=14%这大于10%, 你不能90%相信大多数人会回答是。

如果人口远小于数百人,则对这些结果的置信度会显着增加。在最好的情况下,人口在哪里28或更小,您的样本已经包含一半或更多的“是”响应者,并且您的信心是100%.

表的R计算是

x <- 11:22
y <- round(pbinom(x-1, 22, 1/2, lower.tail=FALSE), 2)
names(y) <- x
print(y)

或者,您可以使用此二项分布的正态近似值并改为计算

y <- round(pnorm(x-1+1/2, 11, sqrt(22*1/2*(1-1/2)), lower.tail=FALSE), 2)

到小数点后两位,结果相同。使用更少的计算,您可以找到近似为 的临界阈值ceiling(qnorm(0.90, 11, sqrt(22*1/2*(1-1/2))) + 1/2),它返回15.