解释一个比例的负置信限

机器算法验证 置信区间 采样
2022-04-02 20:10:34

误差幅度由样本大小决定。

在一份顾问报告(现阶段保密)中,他们收集了 10 名门店经理(总共 200 名门店经理,即目标人群)的回复,并继续发表诸如“只有 20% 的受访者满意与他们商店的销售业绩”。

在这种情况下,误差幅度约为 32%。假设置信水平为 95%,则真实响应介于 -12 和 52% 之间。

如何解释这个结果(尤其是负面部分)?

对小样本量使用误差范围是否明智(例如,目标人群为 60 人中的 15 人)?

3个回答

因为不可能有一个百分比小于零,所以第一个解释是响应是 0% 到 52% 之间的人很高兴。只需用 0 代替负百分比。

更大的问题是为什么他们报告的结果误差如此之大。作为客户,知道 0% 到 52% 的受访者感到高兴是一个毫无意义的结果。由于样本量如此之小,他们将为调查中的每个问题获得如此大的误差范围十个人的样本量太小,无法获得可靠的估计。

对我来说,更大的问题是为什么他们没有对这项工作使用定性方法。

根据下面的评论进行更新:增加误差幅度以减少样本量并不是一个好的前进方式,正如您所看到的那样,您目前拥有的误差幅度。对于 60 人口,您需要对整个人口进行抽样,即进行人口普查,以获得可接受的低误差范围。对于任何调查,不答复偏差都会引起关注。

建议:对于60岁的人口

  1. 如果您希望对结果进行统计分析,请进行人口普查,或
  2. 根据他们已知的态度或观点挑选人群中的一些关键人物,使用定性访谈和报告主题(不要做任何统计,甚至不计算)。对于 10 个人来说,定性访谈与做调查一样快。

问题源于正常性假设并不完全有效。通常报告的简单置信区间假设样本均值呈正态分布,偏差等于标准误差。这个假设是基于中心极限定理,它需要大量的数字。

对于小群体,可以获得准确的频率论置信区间。对于这种情况,快乐/不快乐的结果是二元的,快乐的百分比具有二项分布。

对于这个样本量,一个更有趣的方法是贝叶斯方法——可能的参数值的信念的后验分布是什么。快乐的概率具有先验的贝塔分布。公式很简单,向下滚动到此页面上的收缩系数。 维基百科上的 Beta 二项分布很容易在 Excel 中绘制一个漂亮的图表来显示后验分布。

我同意这里已经发表的声明,但我有这个工具要补充:Newcombe 的被广泛引用的比例计算器使用此工具,2/10(您提到的 20% 情况)的置信限为 {5.7%:51%}。除非您收集更多数据,否则您只能确定只有一半或更少的经理感到高兴。

编辑:链接到大学网站是有问题的,因为网页经常随着教师的来来去去而重组。

试试这个:vassarstats