你能解释一下为什么统计平局不会被天真地拒绝吗?p1-p2< 2教育部p1−p2<2MOE?

机器算法验证 轮询
2022-03-24 19:32:09

我需要帮助解释和引用基本统计文本、论文或其他参考资料,为什么使用民意调查中报告的误差范围 (MOE) 统计数据来天真地宣布统计平局通常是不正确的。

一个例子:候选人 A 在民意调查中领先候选人 B, %,接受调查的选民的误差率为39314.5%500

我朋友的理由是这样的:

由于统计建模的复杂性,误差幅度意味着 A 的真实支持率可能低至 34.5%,而 B 的支持率可能高达 35.5%。因此,A 和 B 实际上处于统计死局。

在清楚地阐明我朋友推理的缺陷时,所有帮助都表示赞赏。我试图解释如果天真地拒绝“A 导致 B”的假设是不正确的。 pApB<2MOE

3个回答

我第一次尝试答案是有缺陷的(见下文有缺陷的答案)。它存在缺陷的原因是报告的误差幅度 (MOE) 适用于候选人的投票百分比,但不适用于百分比的差异。我的第二次尝试明确地更好地解决了 OP 提出的问题。

第二次尝试

OP的朋友理由如下:

  1. 使用给定的 MOE 分别构造候选 A 和候选 B 的置信区间。
  2. 如果它们重叠,我们有一个统计死听,如果没有,那么 A 当前领先 B。

这里的主要问题是第一步无效。为两个候选人独立构建置信区间不是一个有效的步骤,因为两个候选人的投票百分比是因随机变量。换句话说,决定不投票给 A 的选民可能会决定投票给 B。因此,评估领先是否显着的正确方法是构建差异的置信区间。请参阅 wiki,了解如何在某些假设下计算投票百分比差异的标准误差。

下面的错误答案

在我看来,思考投票结果的“正确”方式如下:

在一项针对 500 名选民的调查中,我们看到领先差异高达 8% 的可能性大于 5%。

您是否认为“A 领先 B”或“A 关系 B”取决于您愿意接受 5% 作为截止标准的程度。

用标准差而不是置信区间来解释更容易。

你朋友的结论在最简单的模型下基本上是正确的,你有简单的随机抽样和两个候选者。现在样本比例满足使得因此, ,因此 使这种简单关系成为可能的原因是完全负相关,因为通常 pA+pB=1pB=1pA

Var(pApB)=Var(2pA1)=4Var(pA)
SD(pApB)=2SD(pA).
pApB
Var(pApB)=Var(pA)+Var(pB)2Cov(pA,pB).

在这个简单模型之外,如果pA+pB=1一般不成立,那么你必须考虑到两者之间的相关pApB不包括在误差范围内。这是可能的SD(pApB)2SD(pA).

但所有这些细微差别似乎表明投票机构应该报告差异的误差幅度。内特西尔弗在哪里?

这不仅是一个不好的术语,而且这甚至不是统计上的死胡同。

您不会那样使用重叠的置信区间。如果你真的只想说候选人 A 会赢,那么候选人 A 绝对领先。领先是 8% MOE 6.4%。该减法分数的置信区间不是单个分数的置信区间的两倍。声称围绕每个估计的 CI (±MOE) 的重叠是一个死胡同,这暗示了这一点。假设 N 和方差相等,则差的 MOE 为 sqrt(2) 乘以 4.5。这是因为找到值之间的差异只会使方差加倍(SD 平方)。置信区间基于方差的 sqrt,因此将它们组合为平均值 (4.5) * sqrt(2)。由于您 8% 领先的 MOE 约为 6.4%,因此候选人 A 处于领先地位。

顺便说一句,MOE 非常保守,基于 50% 的选择值。公式是 sqrt(0.25/n) * 2。我们也可以使用一个计算差值标准误差的公式。我们将使用找到的值而不是 50% 的截止值来应用它,这仍然为我们提供了候选人 A 的显着领先 (7.5% MOE)。我相信,鉴于提问者的评论,以及该截止点与所选假设的接近,这可能是他们正在寻找的。

任何对置信区间和功率的介绍都会在这里有所帮助。甚至关于 MOE 的维基百科文章看起来也很不错。