置信区间是否适用于配额抽样?

机器算法验证 采样 轮询
2022-03-21 18:26:59

法国民意调查机构最近发布了一项只能被称为迄今为止关于 2012 年总统选举赛马的最荒谬的民意调查,目前正面临重大危机。法国参议院现在正在考虑通过强制民意调查机构公布其结果的置信区间等方式就该问题立法。

然而,一些民意调查机构反对这项措施,声称置信区间不适用于配额抽样,这是法国民意调查机构使用的方法。由于配额抽样在形式上是非概率抽样,因此这种说法是有道理的。但是由于配额抽样基本上是分层抽样,所以应该应用置信区间,对吗?

我可以询问在法国以外的民意调查机构也使用配额抽样的国家/地区有关此问题的经验吗?

2个回答

正如 whuber 所说,简短的回答是,配额样本是“过时的、众所周知的不良抽样方法的典型代表”,并且“长期以来一直名誉扫地”。更长的答案是,在某些条件下,“类似配额”的样本可以相当好地工作。

这里的附件 A 是最近从选择加入的互联网面板重建代表性结果的工作。本文给出了这种方法的统计基础。长话短说,典型的抽样方案 1) 抽取随机样本,2) 尝试招募受试者,然后 3) 添加分层后权重以补偿响应者的差异。在选择加入方法中,您 1) 非随机招募受试者,2) 将响应与代表性基线进行比较,以及 3) 添加权重以补偿差异。

在实践方面,选择性抽样与配额抽样类似,但统计基础更发达。好处是您可以就代表性抽样、置信区间等做出声明。坏处是您的声明是基于难以验证的关于人们如何自我选择样本的假设。

很多人对这些方法持怀疑态度——它们听起来太像配额抽样。一些证据表明,选择加入抽样至少在某些时候可以很好地发挥作用。因此,尽管存在争议,Polimetrix/YouGov(选择加入抽样模型的早期采用者)似乎做得相当不错。除其他外,他们已经完成了合作国会选举研究的所有数据收集,这是一系列最近的美国全国选举学术研究。

(我很确定 ICPSR 带有这些数据。如果没有,哈佛的社会科学数据宇宙肯定有。很多学者都在使用这些样本中的数据。)

无论如何,您询问了配额抽样。正如您已经在此处的评论线程中看到的那样,任何训练有素的民意测验专家都会告诉您配额抽样是假的。陪审团仍在选择加入抽样。目前,如果您想围绕配额样本绘制置信区间,我会说这些方法是您最好的选择。

  1. 在大多数非强制性调查情况下,不答复存在严重问题。这是从 2002 年开始的:“CMOR,市场和舆论研究委员会 [美国] 最近报告的调查合作率估计平均仅为 14.7%。” 来自 Paul Gerhold,“我相信仍然可以抽取随机样本。我只是不相信可以执行它们。” 在这种情况下,SAMPLE 是随机的这一事实并不是很相关,因为结果数据不是。

  2. 这使得偏差调整成为有效估计的主要问题,而现场方法设计是一个重要组成部分。人们可能想要这样做的方式,以及由此产生的置信度估计,远远超出了这里可以讨论的范围。