我进行了一项调查,向 450 人发送了问卷,但只有 30% 的人回答了问卷。
- 解释通常的推理分析(即在随机抽样假设下发展的推理分析)是否仍然有效?
- 用这些数据做逻辑回归分析是否正确?
- 如果没有,如何进行?
我进行了一项调查,向 450 人发送了问卷,但只有 30% 的人回答了问卷。
使用这些数据进行逻辑回归是否“正确”取决于您的无响应类型。通常,人们区分三种类型的不响应机制。
完全随机缺失:不响应既不依赖于感兴趣的变量也不依赖于协变量。
给定一些协变量,随机缺失:无响应取决于一些协变量,但不取决于感兴趣的变量。有人称之为“可忽略的不回应”
不随机缺失:不响应取决于感兴趣的变量,不能用观察到的协变量完全解释。
如果您处于第一种情况,不回复不会影响结果。它只会导致您的估计精度下降
如果您处于第二种情况,您应该能够成功地模拟无响应并相应地调整数据。
如果你是第三种情况,那你就倒霉了。你无能为力。
如果您想阅读有关该主题的内容,请查看教科书,例如 Sharon Lohr 的“抽样:设计与分析”
高温高压
如果可能的话,在缩放分析结果时要非常小心。不回应往往与兴趣有关。例如,无论人口统计匹配如何,填写公交服务调查的人往往比普通人对乘坐公交更感兴趣。因此,基于受访者本身的估计往往过高。
例如,从标准的 5 点购买意向问题预测消费品销售的旧经验法则是:75% 的人“肯定会购买”,25% 的人“可能会购买”,5% 的人其余的部分。[广告研究基金会箭头项目]
要直接回答这个问题,您当然可以进行逻辑回归,但它有效地应用于您正在分析的人群(即调查受访者的人群)。除此之外的任何事情都是推论,类似于从爱荷华州和威斯康星州的调查中推断明尼苏达州的意见。上面建议的一些策略可以支持该推论,但仍然是一个推论。
在许多情况下,您必须进行推理。客户支付了调查费用,并希望从中至少获得一些有用的信息,因此您必须尽力而为,并提供您认为必要的任何警告。
这是一个简单的答案元素
确定填写表格是否与解释变量相关的一种简单方法是执行逻辑回归,其中二元响应变量如果该人回答则为 1,否则为 0。如果事实证明填写的表格与解释变量无关,那么您的受访者样本可能会被视为您的样本的随机子样本,因此是原始总体的随机样本。当然,你的测试能力会受到影响......
如果您查看丢失数据的问题,您会发现更多。
编辑以前的技术需要一个特殊的框架 --- 请参阅 Whiber 的评论。