证明使用有限总体校正的合理性

机器算法验证 采样 有限种群
2022-03-16 19:22:23

鉴于有限总体校正有效地降低了抽样分布的标准误差,这(与缺乏有限总体校正相比)将增加假设检验的检验统计量(并因此增加拒绝零值的概率),它似乎是一个非常强大的工具,无需强有力的理由即可使用。

这是我认为使用它是合理的一种情况:

[编辑 2 - 我根据史蒂夫的一个非常有效的观点稍微改变了这里的场景。我不希望不答复率分散对有限人口校正的关注]。

我有一家公司在过去 12 个月里有了新的领导层。在旧领导期间,我对 50% 的员工进行了随机抽样(回复率为 100%)。在新的领导下,我对 45% 的员工进行了同样的调查(同样,回复率为 100%)

如果我想查看调查中某些问题的结果如何以统计显着的方式发生变化,我应该应用有限总体校正。我正在比较两个特定时间点的两组员工。除了在这两个时间点在公司内工作的人之外,我不关心任何人。

[编辑 2 - 澄清我的担忧]

此外,那些在这两个时间点不在公司工作的人无论如何都无法回答调查。像“过去几个月我很享受在这里工作”这样的基本问题,只有那些真正在公司工作过的人才能合理地回答。在这种情况下,假设一个无限的人口似乎对抽样分布施加了任意限制。

这是我认为使用它不合理的一种情况:

我对从我这里购买产品的客户样本进行了问卷调查,以评估他们的兴趣,以便我告诉我如何最好地在未来几年内使我的业务多样化。虽然这个样本是我开业以来服务过的所有客户的 20%,但我可以认为这里的人口包括所有没有从我这里购买产品的客户(因为他们不在该地区或我的价格太高或他们不知道我的商店等),因此我有一个人口,使我的样本大小小于它的 1%)。

问题:

人们是否同意我对这两个示例场景的解释?

在制作一件作品时,包含您使用有限总体校正的理由是否是一种好习惯?

这主要是对“谁”人群的评估,以及您是否希望您的结果仅适用于“已知”人群,或者您是否正在寻求提供比“已知”人群具有更广泛应用水平的东西?

1个回答

由于您给出的原因,您对第二种情况是正确的,但对第一种情况却不是。有限总体校正 ( fpc )​​ 的理论仅适用于没有放回的随机样本(Lohr (2009) Sec 2.8, pp 51-530。关键词是随机的。随机样本的标志是选择由随机决定数字或物理等价物。在您的第一个场景中,响应的 45% 的人口不是由随机数选择的。如果 45% 是人口的一个更大的随机样本的一部分,情况也是如此:响应不受控制通过随机数。

即使您有一个具有(接近)100% 响应的大部分人口样本,如果您的研究目的是进行预测、估计优势比或以其他方式检验假设或引用 p,您仍然应该省略 fpc -价值观。推理很有趣(Cochran, 1977, p.39):对于有限的人口,很少有科学兴趣询问零假设(例如,两个比例相等)是否完全正确。除非有非常罕见的机会,否则不会,因为通过枚举整个人口会发现这一点。这导致采用“超人口”观点,如今几乎所有统计学家都采用这种观点。您的第二种情况是这种情况的一种变体。另见 Deming(1966) 第 247-261 页“枚举和分析研究之间的区别”;Korn 和 Graubard(1999 年),p。227.

11 月 26 日添加 我应该注意到有限总体校正在这里是一个小问题。主要问题是 55% 的不答复和随后的不答复偏差。调查专业人士普遍同意,最好采取较小的可管理样本,并通过个性化初始联系和跟进无响应者来专注于减少无响应。调查后加权修正也可能有所帮助,但会增加标准误差。

综上,回答你的三个问题:

  1. 您对第一种情况的解释是不正确的。
  2. 你真的不需要说什么。如果您的目标仅描述您从中抽取样本的有限总体,那么您可以提及您省略了 fpc,因为效果微乎其微。否则,当您进行假设检验或预测时,您可能会提到省略 fpc,但我从未见过有人这样做。
  3. 是否使用fpc的决定是您在问题中描述的评估。所以答案是“是”。

附加讨论请在此处查看相关的简历讨论

参考

科克伦,WG(1977)。抽样技术(第 3 版)。纽约:威利。

戴明,我们(1966 年)。一些抽样理论。纽约:多佛出版社。

Korn, EL 和 Graubard, BI (1999)。健康调查分析(概率和统计中的威利系列)。纽约:威利。

Levy、Paul S 和 Stanley Lemeshow。2008. 人口抽样:方法和应用。调查方法中的威利系列。新泽西州霍博肯:威利。

Lohr, Sharon L. 2009。抽样:设计和分析。马萨诸塞州波士顿:Cengage Brooks/Cole。