这张图表显示恐怖袭击的可能性在统计上有用吗?

机器算法验证 可能性 解释 预言
2022-02-03 03:13:28

我看到这张图片流传了很多。

我有一种直觉,以这种方式提供的信息在某种程度上是不完整的,甚至是错误的,但我对统计数据不够精通,无法做出回应。这让我想起了这部xkcd 漫画,即使有可靠的历史数据,某些情况也会改变预测事物的方式。

它做什么宝贝

这张图表是否有助于准确显示难民的威胁程度?是否有必要的统计背景使该图表或多或少有用?


注意:尽量保持通俗易懂:)

4个回答

想象一下,你的工作是预测明年死于各种原因的美国人的数量。

开始分析的合理起点可能是2014 年国家生命统计数据最终死亡数据。假设 2017 年可能看起来与 2014 年大致相同。您会发现 2014 年约有 2,626,000 名美国人死亡:

美国的恐怖事件非常罕见,因此估计一年会出现问题。查看时间序列,您会看到绝大多数美国恐怖主义死亡事件发生在 9/11 袭击事件期间(请参阅国家恐怖主义研究和应对恐怖主义联盟的这份报告。)我已经复制了他们的下图1:

国家恐怖主义和应对恐怖主义研究联合会,“美国在恐怖袭击中的死亡情况简介”

您会立即发现您遇到了异常值、罕见事件问题。一个异常值正在推动整体数字。如果您试图预测恐怖主义造成的死亡人数,则会出现许多问题:

  • 什么算恐怖主义?
    • 恐怖主义可以广义或狭义地定义。
  • 过程是静止的吗?如果我们采用时间序列平均值,我们在估计什么?
  • 条件有变化吗?以当前条件为条件的预测是什么样的?
  • 如果绝大多数死亡来自一个异常值,你如何合理地建模呢?
    • 从某种意义上说,我们可以通过更广泛地观察其他国家并追溯更远的时间来获得更多数据,但是对于这些模式中的任何一个是否适用于当今世界存在疑问。

恕我直言,FT 图表选择了一个过于狭窄的定义(9/11 袭击没有出现在图表中,因为袭击者不是难民)。该图表存在合理的问题,但英国《金融时报》更广泛的观点是正确的,即美国的恐怖主义非常罕见。你在美国被外国出生的恐怖分子杀死的机会接近于零。

美国的预期寿命约为 78.7 岁。过去使预期寿命下降的原因是1918 年西班牙流感大流行或二战等事件。现在预期寿命的其他风险可能包括肥胖和阿片类药物滥用。

如果您试图对恐怖主义风险进行详细估计,则会出现巨大的统计问题,但要了解全局,需要了解的数量级和基本的定量素养并不需要太多的统计数据。

一个更合理的担忧......(也许偏离主题)

回顾历史,大量人死于疾病、种族灭绝和战争。更合理的担忧可能是一些罕见的恐怖事件引发了灾难性事件(例如,费迪南德大公被暗杀如何帮助引发了第一次世界大战。)或者人们可能会担心核武器掌握在疯狂的人手中。

考虑极其罕见但灾难性的事件非常困难。这是一个多学科的追求,远远超出了统计范围。

也许这里唯一的统计点是很难估计一些尚未发生的事件的概率和影响?(除非说它不可能那么普遍,否则它已经发生了。)

图表问题:

  1. 这意味着难民比其他人群更有可能犯下恐怖行为。为什么不从一般移民的角度来界定它呢?一个国家自己的公民所犯下的恐怖行为又如何呢?

  2. 它如何定义难民?

  3. 比较组没有意义。如果我们要查看杀戮,为什么不将其与其他形式的杀戮进行比较,例如那些在与枪支有关的犯罪中丧生的人。与雷击(人类无法控制)或彩票中奖(这将是积极而非消极的事情)相比,意义不大。

  4. 它非常笼统。以每十亿人的百分比表示,这表明这些概率是普遍正确的。

  5. 如果我们要利用其他先验知识,例如地理位置、一段时间内跨国移动的人数比较、目的地国难民的融合程度等,这些信息会更有用。条件概率是通常比一般概率更有用。(例如,我们知道委内瑞拉的雷击次数多于英国南部,那里的卡塔通博河与马拉开波湖(显然是地球上被雷击最多的地方)交汇处。)正如问题所述,依靠一般无条件的概率会导致得出错误的结论:

在此处输入图像描述

如果没有至少以下信息,这张图表绝对是不完整的:如何为这些目的定义“恐怖主义”,如何为这些目的定义“难民”,这些数据涵盖的时间跨度以及包括哪些人——例如,雷击数据是否包括住在疗养院且从不外出的人?

大概(希望)至少其中一些要点包含在使用此图形的文章和论文中。我还将假设具体数字是相当准确的。

这张图表是否有助于准确显示难民的威胁程度?

不是真的它告诉我们难民恐怖主义的威胁程度与雷击和自动售货机事故的威胁程度相比如何如果我们试图决定是投入资源限制难民入境还是彻底改革自动售货机设计,这可能是有用的信息。但我们不是。

是否有必要的统计背景使该图表或多或少有用?

绝对地!人们用这张图表来争辩说“难民并不危险”,但这是一种误导,因为没有人真正关心难民与闪电相比是否危险

好吧,你可以争辩说,因为其他事情更危险,我们都应该完全停止担心不那么危险的事情。不要担心难民,因为闪电更危险!不要担心飞机失事,因为汽车更危险!就个人而言,我认为这是一个愚蠢的论点,特别是因为有时不太可能的不良结果更容易预防,因此在某种意义上更值得花费资源来预防。此外,我最近还没有看到有人就难民或恐怖主义提出这种论点。

如果我们要讨论限制难民入境以防止恐怖主义是否有意义,还有更多有用的东西可以看。(是否有可靠的数据可供他们使用是另一个问题,但即使没有,也不能成为查看无用数据并假装有用的借口。)

  1. 我们可以将在恐怖袭击中被难民杀死的可能性与在恐怖袭击中被非难民杀死的可能性进行比较。

    • 如果假设第一个是四倍的可能性,那就意味着 4/5 的恐怖主义死亡是由难民造成的,所以如果我们禁止难民,它可以将恐怖主义死亡人数减少 80%,其他因素保持不变。这样的政策会产生什么其他后果,以及它是否是一个平衡的好主意,与闪电死亡无关
    • 也许第二个的可能性是 1000 倍。我不知道,我不能从这张图表中看出。
    • 旁注:美国恐怖主义造成的总体死亡人数一开始就很低,因此我们可能无法得出强有力的推论。
  2. 我们还可以将难民成为恐怖分子的可能性与非难民移民成为恐怖分子的可能性或非移民成为恐怖分子的可能性进行比较。

  3. 我们可以查看这些概率中的任何一个如何随时间变化,以及它们与其他因素(例如全球冲突水平)的关系,这可能会为我们提供一些线索,说明该图表所基于的过去数据实际上是多少可能会告诉我们关于未来的事情。

  4. 我们可以查看被难民、自动售货机或雷击杀死的可能性,这些可能性取决于您与每个人互动的频率

    • 由于人们与自动售货机的接触比与难民的接触更多,因此即使与随机的自动售货机/人的互动相比,随机的难民/非难民互动更有可能导致死亡,自动售货机也可能导致更多的死亡。是不是更有可能?我不知道,我不能从这张图表中看出。
    • 甚至根据这张图表说“难民比自动售货机更危险”都是误导性的。这就像说一种罕见病比一种常见病“危险性小”,而不看哪种病的致死率更高。对于“不那么危险”的某种含义来说确实如此,但这与讨论采取何种预防措施来防止这种通常罕见的疾病的潜在爆发完全无关。

几乎所有这些统计数据都比这张图表中的数据更有助于讨论和制定有关难民入境的政策,但它们可能不那么可爱和可分享。

关于严重恐怖事件的频率

本文试图模拟发生任何给定严重程度的恐怖袭击的可能性。结论是恐怖事件遵循幂律分布,即“尾重”。这意味着大多数与恐怖主义有关的死亡是由于 9/11 之类的事件而发生的,这似乎是异常值,或者,正如作者所说

这些分布的上尾的规则缩放立即表明,比平均事件大小大几个数量级的事件不是异常值,而是与恐怖袭击频率统计中的全球模式一致。

该图表可能没有说明这一点——它似乎只是在计算被恐怖分子杀害的人数。以此类推,加利福尼亚州的绝大多数地震死亡来自 1906 年的一次地震。对地震造成的威胁进行建模必须考虑到真正大地震的风险,对恐怖主义风险进行建模必须考虑到真正大恐怖主义的风险。