当调查回复率仅为 30% 时对人群的推断

机器算法验证 采样 民意调查 缺失数据 推理 不回应
2022-03-26 17:47:18

我进行了一项调查,向 450 人发送了问卷,但只有 30% 的人回答了问卷。

  • 解释通常的推理分析(即在随机抽样假设下发展的推理分析)是否仍然有效?
  • 用这些数据做逻辑回归分析是否正确?
  • 如果没有,如何进行?
4个回答

使用这些数据进行逻辑回归是否“正确”取决于您的无响应类型。通常,人们区分三种类型的不响应机制。

  1. 完全随机缺失:不响应既不依赖于感兴趣的变量也不依赖于协变量。

  2. 给定一些协变量,随机缺失:无响应取决于一些协变量,但不取决于感兴趣的变量。有人称之为“可忽略的不回应”

  3. 不随机缺失:不响应取决于感兴趣的变量,不能用观察到的协变量完全解释。

如果您处于第一种情况,不回复不会影响结果。它只会导致您的估计精度下降

如果您处于第二种情况,您应该能够成功地模拟无响应并相应地调整数据。

如果你是第三种情况,那你就倒霉了。你无能为力。

如果您想阅读有关该主题的内容,请查看教科书,例如 Sharon Lohr 的“抽样:设计与分析”

高温高压

如果可能的话,在缩放分析结果时要非常小心。不回应往往与兴趣有关。例如,无论人口统计匹配如何,填写公交服务调查的人往往比普通人对乘坐公交更感兴趣。因此,基于受访者本身的估计往往过高。

例如,从标准的 5 点购买意向问题预测消费品销售的旧经验法则是:75% 的人“肯定会购买”,25% 的人“可能会购买”,5% 的人其余的部分。[广告研究基金会箭头项目]

要直接回答这个问题,您当然可以进行逻辑回归,但它有效地应用于您正在分析的人群(即调查受访者的人群)。除此之外的任何事情都是推论,类似于从爱荷华州和威斯康星州的调查中推断明尼苏达州的意见。上面建议的一些策略可以支持该推论,但仍然是一个推论。

在许多情况下,您必须进行推理。客户支付了调查费用,并希望从中至少获得一些有用的信息,因此您必须尽力而为,并提供您认为必要的任何警告。

  1. 忽略它(风险自负)。(按照大多数标准,30% 可能是一个很好的回报率。)
  2. 重新抽样一些无响应者(使用稍微不同的调查,也许还有一些“挑逗者”以引起兴趣),看看他们的反应是否与原始样本不同(请记住,您将获得更差的响应率和更多在第二个示例中出现偏差)。
  3. 分析响应者与人口的人口统计(和其他兴趣)(如果您对调查中的人口统计/兴趣有任何线索)。根据该信息扩展响应。

这是一个简单的答案元素

确定填写表格是否与解释变量相关的一种简单方法是执行逻辑回归,其中二元响应变量如果该人回答则为 1,否则为 0。如果事实证明填写的表格与解释变量无关,那么您的受访者样本可能会被视为您的样本的随机子样本,因此是原始总体的随机样本。当然,你的测试能力会受到影响......

如果您查看丢失数据的问题,您会发现更多。

编辑以前的技术需要一个特殊的框架 --- 请参阅 Whiber 的评论。