COVID-19 大流行曲线是高斯曲线吗?

机器算法验证 正态分布 时空 流行曲线
2022-01-29 06:59:41

我们都听说过很多关于“拉平曲线”的事情。我想知道这些看起来像铃铛的曲线是否可以被视为高斯曲线,尽管存在时间维度。

在此处输入图像描述

4个回答

不。

例如:

  • 不是在高斯概率分布的意义上:正态(高斯)分布的钟形曲线是直方图(概率密度相对于单个变量值的映射),但您引用的曲线是(如您所述)a一个变量(新案例)的值与第二个变量(时间)的映射。(@Accumulation 和@TobyBartels 指出高斯曲线是可能与概率分布无关的数学结构;鉴于您在统计 SE 上提出这个问题,我认为解决高斯分布是回答问题的重要部分。 )

  • 正态分布下的可能值从扩展到,但流行曲线在y轴上不能有负值,并且在x轴上向左或向右移动足够远,您将完全用完病例,要么因为疾病不存在,或者因为智人不存在。

  • 正态分布是连续的,但流行曲线测量的现象实际上是离散的而不是连续的:它们代表每个离散时间单位内的新病例。虽然我们可以将时间细分为更小的有意义的单位(在一定程度上),但我们最终会遇到这样一个事实,即新感染的个体是计数数据(离散的)。

  • 正态分布关于它们的均值是对称的,但尽管漫画传达了一个有用的公共卫生信息,即需要使曲线变平,但实际的流行病曲线经常向右倾斜,如下图所示长而细的尾巴。

2016 年 9 月 15 日世卫组织安哥拉黄热病情况报告中的流行曲线:http://www.who.int/emergencies/yellow-fever/situation-reports/23-september-2016/en/

  • 正态分布是单峰的,但实际的流行曲线可能具有一个或多个颠簸(即可能是多峰的,它们甚至可能像@SextusEmpiricus 的回答一样,在周期性返回的地方流行)。

  • 最后,这是中国 COVID-19 的流行曲线,您可以看到该曲线通常与高斯曲线不同(当然数据的可靠性存在问题,因为很多病例都没有计算在内):

COVID-19 流行曲线,中国,2019 年 12 月 31 日至 2020 年 2 月 25 日

呼吸道感染的流行病学曲线是非常不规则的曲线。参见例如 2002/2003 年的 SARS 爆发

非典 https://www.who.int/csr/sars/epicurve/epiindex/en/index1.html

对于地方病,它们可能有一些季节性模式。参见例如euromomo徽标

季节性流感和普通感冒
(来源:euromomo.eu

除了通常不是高斯曲线的曲线变平之外,情况也会更加微妙。互联网上流传的图像是一个非常极端的情况,曲线远远高于阈值,并且由于采取了措施,其尺寸正在减半。它勾勒出一个完美的局面,可以主张采取严厉的措施。对于covid-19,情况可能不一定如此。

更细微的表示显示不同的阈值,并在曲线中有更细微的差异。像这儿

带阈值的曲线

https://www.vaccinarsinpuglia.org/notizie/2017/10/al-via-la-sorveglianza-dellinfluenza-stagione-2017-18

这里似乎有三个问题:

  1. 案例的实际分布是​​高斯分布吗?不。

  2. 图形中给出的曲线是高斯曲线吗?不完全的。我觉得红色的有点歪,蓝色的肯定歪了。

  3. 可以将值与时间的图视为高斯图吗?是的。

在数学中,高斯函数,通常简称为高斯,是形式为 对于任意实常数 a、b 和非零 c。

f(x)=ae(xb)22c2

https://en.wikipedia.org/wiki/Gaussian_function

不要求它是概率分布。

我不是流行病学家,你应该向流行病学家提出这个问题。

首先,绘制高斯曲线很简单,因为即使是基本的绘图软件(例如Microsoft Excel)也实现了它们,所以当人们需要绘制“分布”时,他们通常会绘制高斯曲线。“拉平曲线”图旨在显示该现象的一般概念,而不是该现象的确切分布(没有人事先知道,因为未知数太多,活动部件太多)。甚至人物的比例也不现实;一些专家指出,差异可能远高于这些数字。

至于流行病的高斯形状,据我所知,这被称为法尔定律首先感染人数上升,然后下降,所以这类似于高斯曲线,但远非完全拟合。您可以在此 Twitter 线程中找到讨论,该帖子作为一项研究的示例,将法尔定律应用于预测美国的 HIV/AIDS 病例,从图中可以看出,它与实际结果无关。

在此处输入图像描述

您可以在Ferguson 等人 (2020)最近被广泛引用的论文中找到一些更严重的数据正如你所看到的,它们是“上升和下降,但远离高斯分布,在某些模拟中甚至是多峰的,或者是倾斜的。当然,这仍然是一个模拟,因此比我们从实际数据中可以预期的分布要简化得多。

在此处输入图像描述

在此处输入图像描述