怀疑韩国选举被操纵

机器算法验证 可能性
2022-03-21 23:17:56

2020 年 4 月 15 日,韩国第 21 次立法选举举行。

韩国有两种提前投票制度。一种是投票给您所在地区的候选人。另一种是投票给您的地址注册但您不能去的其他本地区域的候选人。我将分别称其为 A 和 B。

这是延寿区提前投票的结果。我从全国选举委员会带来了这些数据。

如您所见,如果我们将 B 除以 A,我们得到几乎相同的结果,即 0.39。不仅在这个区域,而且在其他区域,某些数字会出现,例如 0.29、0.26 等。我的问题是,从随机的角度来看有可能吗?

提前投票率

2个回答

如果选民在 A 和 B 之间随机分配,那么他们的投票行为相同并且(鉴于所涉及的人数众多)在 A 和 B 的每个政权下对每一党的投票比例也几乎相同也就不足为奇了.

但是,我预计,例如,从居住区流动性较差的老年人将主要属于 A 制度,而年轻人(例如,离家学习)将属于 B 制度。如果老年人和年轻人的投票方式不同(看起来很可能),我同意你的观点,结果令人惊讶。

我不太熟悉选举结果应该是什么样子,例如变化有多大以及它与原假设列联表的差异有多大。

查看结果,我们可以进行类似于您所拥有的 chi-sq 测试:

M = matrix(c(15797,6185,11335,4460,5296,2073),ncol=3)
chisq.test(M)

    Pearson's Chi-squared test

data:  M
X-squared = 0.052314, df = 2, p-value = 0.9742

如果我们问得到接近预期结果的概率,即 X 平方小于 0.052314,则为 1 - 0.9742 = 0.0258。通常我们会这样做:

pchisq(0.052314,2)
[1] 0.02581787

然而,这只是 1 次观察/实验。理想情况下,您收集许多局部区域的此类统计数据并执行相同的分析,并询问此结果是否是暂时的或确实存在趋势。

我可以举一个众所周知的例子,RA Fisher 在 Gregor Mendel 的实验数据中注意到,对于许多实验,具有某种表型的种子数量与预期非常接近。数据与理论非常吻合。他测试了孟德尔每次实验得到的卡方小于观察值的概率,并假设如果它们是独立的并遵循原假设,那么在重复所有实验的情况下获得总体更好结果的概率为 7/100000 . 有关本文分析的更多详细信息

费舍尔甚至提出:

“尽管没有任何解释是令人满意的,但孟德尔仍有可能被某个非常了解预期结果的助手欺骗了。这种可能性得到了独立证据的支持,即大多数(如果不是全部)的数据为了与孟德尔的预期非常吻合,这些实验被篡改了。”

指出上述例子的原因是,即使是费舍尔的分析,孟德尔是否操纵了他的数据仍然存在广泛的争论,因为还有一些我们仍然知之甚少的生物学原因。它超越了统计数据。

从对 1 次选举结果的分析中不能轻易得出结论,这是被操纵的。即使您在多个领域收集数据,仍然需要考虑和考虑许多因素。