为什么声称样本通常比人口普查更准确?

机器算法验证 估计 采样 民意调查 偏见
2022-03-14 01:13:37

在学习采样的过程中,我遇到以下两种说法:

1)抽样误差主要导致可变性,非抽样误差导致偏差。

2)由于非抽样误差,样本通常比人口普查更准确。

我不知道如何理解这两种说法。获取这两个语句的基本逻辑是什么?

4个回答

如果这项工作是人口普查的事实增加了非抽样误差的偏差,那么样本可能比(尝试的)人口普查更准确。例如,如果人口普查引发了一场提倡不答复的不利政治运动(样本不太可能发生这种情况),这可能会发生。除非发生这种情况,否则我看不出为什么样本的非抽样误差比人口普查要少;根据定义,它会有更多的抽样误差。因此,除了非常不寻常的情况外,我会说人口普查将比样本更准确。

考虑一个常见的非抽样误差来源——系统性的不响应,例如特定社会人口群体。如果来自 X 组的人可能会拒绝人口普查,那么他们同样可能会拒绝样本。即使使用后分层抽样来加权 X 组中您确实说服回答您的问题的人的回答,您仍然会遇到问题,因为这些可能正是 X 中支持调查的部分。除了尽可能小心地设计仪器和交付方法之外,没有真正的方法可以解决这个问题。

顺便说一句,这确实引起了人们对一个可能使尝试的人口普查不如样本准确的问题的关注。样本通常对人口具有后分层权重,这减轻了诸如我上面段落中的问题的偏见问题。未获得 100% 回报的尝试性普查只是一个大样本,原则上应进行同样的处理;但由于它被视为“人口普查”(而不是试图进行的人口普查),因此可能会被忽略。因此,人口普查可能不如适当加权的样本准确。但在这种情况下,问题在于分析处理技术(或遗漏),而不是试图进行人口普查的内在因素。

效率是另一回事——正如米歇尔所说,一个执行良好的样本将比人口普查更有效率,而且它很可能具有足够的准确性用于实际目的。

我认为在某些实际情况下,样本可以更准确。例如,我们在一个发展中国家的一个城市进行了一项研究,那里有很多人生活在未注册的地方,人们不断地来来往往,对回应感到害羞。试图真正进行人口普查需要付出巨大的努力,而且考虑到我们的资源,它必须在几个月的时间里完成,那时人们会来来往往。有了样本,我们可以花更多时间确保我们尽可能接近完全响应——因为我们可以解释我们在做什么——而且我们可以在更短的时间内完成这将解决问题进出城市的人。

所以我认为答案更多地取决于你在做什么的后勤工作,以及非抽样误差的各种来源。

事实上,另一个来源是我们的调查很复杂,我们必须培训采访员,而在那个国家找到并资助足够的可培训采访员将非常困难。

在对人类进行抽样调查时,样本通常会同时受到抽样误差(我们只得到估计值)非抽样误差(例如,人们拒绝回答自己的调查,由于成本等实际考虑,没有对所需的样本框架进行抽样,或者无法准确识别总体以抽取样本)。正确完成,响应率高,样本比人口普查更有效率。但是假设没有样本包含非抽样误差是不正确的。

我认为他们的关键在于彼得埃利斯的回答:“尝试过”。当您正确地进行抽样时,您会发现未答复的细节,找出分层并找出它们等等。当您决定进行人口普查时,很容易忽略这些问题,因为您得到的是“每个人”。问题是,你可能没有得到所有人,但你没有考虑你实际上没有得到谁。

非常大的样本(作为抽样人口的一部分)也存在统计问题。我不够老练,无法理解它们,但至少你在方差计算方面有问题。(像 R 之类的包survey在调查的大型子群体中补偿了这些东西,这就是我第一次了解到这一点的地方。)

作为次要问题,如果非样本错误包括由于流程中各个步骤的质量控制引起的问题,那么拥有大量数据(人口普查)将使您更难以拥有您将拥有的质量控制水平(使用相同的资源)在较小的数据集(样本)上。

想象一下,如果您拥有美国人口普查局用于人口普查的资源(财务和人员),但您只是对 1,000 名随机成年人进行调查。我认为你会有更好的质量控制和更好的分析所涉及的问题和数据本身。