单个现实生活中未来事件的概率:当他们说“希拉里有 75% 的机会获胜”时是什么意思?

机器算法验证 可能性 预言 政治
2022-01-28 23:46:51

由于选举是一次性事件,它不是一个可以重复的实验。那么“希拉里有 75% 的获胜机会”这句话在技术上究竟是什么意思呢?我正在寻求一个统计上正确的定义,而不是直观或概念上的定义。

我是一名业余统计爱好者,试图回答讨论中提出的这个问题。我很确定对此有很好的客观回应,但我自己无法想出...

4个回答

到目前为止提供的所有答案都是有帮助的,但它们在统计上并不是很精确,所以我会试一试。同时,我将给出一个笼统的答案,而不是专注于这次选举。

The first thing to keep in mind when we're trying to answer questions about real-world events like Clinton winning the election, as opposed to made-up math problems like taking balls of various colors out of an urn, is that there isn' t 一个独特的合理方式来回答问题,因此不是一个独特的合理答案。如果有人只是说“希拉里有 75% 的机会获胜”,而没有继续描述他们的选举模型、他们用来进行估计的数据、模型验证的结果、他们的背景假设,以及他们是否'指的是普选票或选举人票等,那么他们并没有真正告诉你他们的意思,更不用说提供足够的信息让你评估他们的预测是否好。此外,它不是

那么,统计学家可以使用哪些程序来估计克林顿的机会呢?的确,他们如何界定问题?在高层次上,概率本身有多种概念,其中最重要的两个是频率论者和贝叶斯论者。

  • 频率论者的观点中,概率代表事件在同一实验的许多独立试验中的极限频率,如大数定律(强或弱)。尽管任何特定的选举都是一个独特的事件,但它的结果可以看作是从无数历史事件和假设事件中汲取的,这些事件可能包括所有美国总统选举,或 2016 年全球所有选举,或其他。克林顿获胜的几率为 75%,这意味着如果X1,X2,是独立选举的结果序列(0 或 1),就我们的模型而言,它们完全等同于这次选举,那么样本均值X1,X2,,Xn收敛到 0.75 的概率为n走向无穷大。

  • 贝叶斯观点中,概率代表一定程度的可信度或可信度(这可能是也可能不是实际的信念,取决于您是否是主观贝叶斯主义者)。克林顿获胜的几率为 75%,这意味着她获胜的可信度为 75%。反过来,可信度可以在概率的基本定律(如贝叶斯定理)的约束下自由选择(基于模型或分析师的预先存在的信念),并且联合事件的概率不能超过任何一个的边际概率这一事实组件事件)。总结这些规律的一种方法是,如果你对事件的结果下注,根据你的可信度向赌徒提供赔率,那么赌徒就无法制作一本荷兰书对你不利,即一组赌注,保证无论赛事实际结果如何,你都会赔钱。

无论您对概率采取频率论者还是贝叶斯论者,对于如何分析数据和估计概率,仍有许多决定要做。可能最流行的方法是基于参数回归模型,例如线性回归。在这种情况下,分析人员选择一个由称为参数的数字向量索引的参数分布族(即概率度量)。每个结果都是从该分布中提取的独立随机变量,根据协变量进行转换,协变量是分析师想要用来预测结果的已知值(例如失业率)。分析师使用数据和模型拟合标准(例如最小二乘法)选择参数值的估计值最大似然使用这些估计,模型可以为协变量的任何给定值生成结果预测(可能只是一个值,可能是一个区间或其他一组值)。特别是,它可以预测选举的结果。除了参数模型之外,还有非参数模型(即,由一系列分布定义的模型,该分布族以无限长的参数向量为索引),以及决定预测值的方法,这些方法根本不使用生成数据的模型,例如最近邻分类器随机森林

做出预测是一回事,但你怎么知道它们是否有用?毕竟,足够不准确的预测比无用更糟糕。测试预测是模型验证更大实践的一部分,即量化给定模型对于给定目的的好坏程度。验证预测的两种流行方法是交叉验证和在拟合任何模型之前将数据拆分为训练和测试子集。如果数据中包含的选举代表了 2016 年美国总统大选,我们通过验证预测获得的预测准确性估计将告诉我们我们对 2016 年美国总统大选的预测有多准确。

当统计学家想要预测一个二元结果(希拉里获胜 vs 希拉里没有获胜)时,他们会想象宇宙正在抛一枚假想的硬币——正面朝上,希拉里获胜;尾巴,她输了。对一些统计学家来说,硬​​币代表他们对结果的信任程度;对其他人来说,这枚硬币代表了如果我们在同样的情况下一遍又一遍地重新选举可能会发生什么。从哲学上讲,当我们谈论不确定的未来事件时,即使在我们将数字拖入其中之前,也很难知道我们的意思。但是我们可以看看这个数字是从哪里来的。

在选举的这一点上,我们有一系列的民意调查结果。这些是以下形式:在俄亥俄州等地对 1000 人进行了民意调查。40%支持特朗普,39%支持希拉里,21%未定。对于各自的民主党、共和党(和其他跟踪党)候选人,之前的选举将进行类似的民意调查。往年也有成果。你可能知道,比如说,在 7 月的一次民意调查中,获得 40% 选票的候选人在之前的 10 次选举中赢得了 8 次。或者结果可能会说,在 10 次选举中有 7 次,民主党人拿下了俄亥俄州。您可能知道俄亥俄州与德克萨斯州的比较(也许他们从不选择同一个候选人)——您可能有关于未决投票如何分解的信息——并且您可能有关于候选人开始“激增”时会发生什么的有趣模型。

所以当你考虑到以前的选举时,你可以说选举硬币已经被扔了很多次。同样的选举不是每 4 年重新进行一次,但我们可以假装它是。根据所有这些信息,民意测验者建立了复杂的模型来预测今年的结果。

希拉里 75% 的获胜机会是相对于我们“今天”的知识水平而言的。这就是她有“现在”的民意调查结果的候选人,在她拥有它们的状态下,在整个活动中赋予了她民意调查的趋势,赢得了3个选举年的选举。一个月现在,她获胜的概率将发生变化,因为该模型将基于 8 月份的民意调查状态。

美国在其历史上没有进行过统计上大量的选举,更不用说自民意调查开始以来。我们也不能确定 70 年代的民意调查趋势仍然适用。所以这一切都有点狡猾。

底线是希拉里应该开始准备她的就职演说。

当统计学家这样说时,他们指的不是胜利的幅度或投票的份额。他们正在运行大量的选举模拟,并计算每个候选人获得的选票百分比。对于许多强大的总统模型,他们对每个州都有预测。有些人很接近,如果比赛进行多次,两位候选人都有可能获胜。因为预测间隔多次与 0 的胜利边际重叠,所以它不是二元响应,而是模拟会更准确地告诉我们会发生什么。

FiveThirtyEight 的方法页面可能有助于了解更多内容:http: //fivethirtyeight.com/features/a-users-guide-to-fivethirtyeights-2016-general-election-forecast/

有一集与这个问题非常相关的怪诞经济学广播(一般而言,与选举的细节无关)。在其中,斯蒂芬·杜布纳采访了美国国防机构的一个项目负责人,以确定预测全球政治事件的最佳方式。

与大多数人相比,它 [还] 有助于更多地了解政治。我会说它们几乎是做好的必要条件。但它们还不够,因为有很多人非常聪明和心胸狭窄。有很多人非常聪明,认为不可能将概率附加到独特的事件上。

然后他们讨论该做什么

如果你问这些类型的问题,大多数人会说,“你怎么可能给看似独特的历史事件分配概率?” 似乎没有任何方法可以做到这一点。我们真正能做的最好的事情是,使用模糊的措辞,做出模糊的预测。我们可以说,“好吧,这可能会发生。这可能会发生。这可能会发生。” 说可能发生的事情并不是说很多。

然后这一集进入了最成功的预测者用来估计这些概率的方法,倡导一种非正式的贝叶斯方法

所以,对非洲独裁者甚至这个国家一无所知,假设我从来没有听说过这个独裁者,我从来没有听说过这个国家,我只是看看基准利率然后我说,“嗯,看起来像大约 87%。” 那将是我最初的预感估计。那么问题来了,“我该怎么办?” 好吧,然后我开始了解这个国家和独裁者。如果我得知这个独裁者已经 91 岁并且患有晚期前列腺癌,我应该调整我的概率而如果我得知京城发生骚乱,并且有军事政变的迹象,我应该再次调整我的概率但是从基本概率开始是一个好方法,至少可以确保你一开始就处于合理性范围内。

这一集被称为如何在预测未来时变得不那么可怕,是一个非常有趣的听。如果您对这类事情感兴趣,我鼓励您检查一下!