为了达到那种程度的自信,你必须满足最严格的批评者。他们会要求你建立
您的样本确实是一个简单的随机样本。
受访者诚实而正确地回答。
如果人口中最赤裸裸的少数人,即不到一半的人实际上会回答“是”,那么您将拥有不到100−90%=10%在这样一个随机样本中至少观察到这么多肯定的机会。
你地址(1)通过解释和记录您识别人群并从中获取样本的程序。
你地址(2)通过记录提问是如何进行的,并包括额外的问题来评估可靠性和内部一致性。
你地址(3)通过计算观察机会14最多时随机样本中的一个或多个是50%如果被问到,人口的回答是肯定的。让我们这样做。
假设人口很大(任何大于几百都可以),yes 计数的分布将非常接近带有参数的二项式22和p<50%. 在最坏的情况下,你必须处理,采取p=50%.
这是相关机会的部分图表。第一行是阈值计数;低于它是样本中的计数等于或超过它的机会。
Threshold: 11 12 13 14 15 16 17 18 19 20 21 22
Chance: 0.58 0.42 0.26 0.14 0.07 0.03 0.01 0.00 0.00 0.00 0.00 0.00
由于 14 或更多的机会是0.14=14%这大于10%, 你不能有90%相信大多数人会回答是。
如果人口远小于数百人,则对这些结果的置信度会显着增加。在最好的情况下,人口在哪里28或更小,您的样本已经包含一半或更多的“是”响应者,并且您的信心是100%.
表的R计算是
x <- 11:22
y <- round(pbinom(x-1, 22, 1/2, lower.tail=FALSE), 2)
names(y) <- x
print(y)
或者,您可以使用此二项分布的正态近似值并改为计算
y <- round(pnorm(x-1+1/2, 11, sqrt(22*1/2*(1-1/2)), lower.tail=FALSE), 2)
到小数点后两位,结果相同。使用更少的计算,您可以找到近似为 的临界阈值ceiling(qnorm(0.90, 11, sqrt(22*1/2*(1-1/2))) + 1/2),它返回15.