如何使用年龄调整死亡率等硬数据(暂时)估计一个地区的实际 COVID-19 感染人数?

机器算法验证 估计 流行病学 指数分布 疾病
2022-03-19 09:46:41

当前 COVID-19 流行的一个大问题是难以接受检测(由于症状轻微和缺乏检测试剂盒)。这使得症状很少或没有症状的患者无法知道自己被感染和进一步传播疾病的可能性有多大。

有可用的估计值,但仅考虑确诊病例(范围在此数字的 10 倍至 1000 倍之间)。如何通过使用可能更稳健的分布的次要特征来估计患者数量?重症监护下的年龄调整死亡率可能是几个这样的参数之一。

在此处输入图像描述

2个回答

死亡率

当死亡的人很可能在当地感染了病毒时,使用死亡率可能会起作用。

然而,目前,许多人死亡是因为他们在访问另一个地区时感染了病毒,或者因为他们从另一个在国外感染病毒的人那里感染了病毒。

因此,这个基于死亡率的数字不是很准确,除非病毒已经完全扩散(在这种情况下,它更有可能从本地感染源)。

对于武汉、意大利和其他疫情中心的病例,由于本地感染而不是外国感染而传播更多,死亡率可能是一个很好的探测(尽管你仍然需要处理延迟)。

此外,虽然死亡率可能比总感染病例更值得信赖(想想德国人,有大量物资,正在对成千上万的人进行检测,而供应有限的邻国正试图限制尽可能多地使用测试),它仍然是一个有偏见的数字。确定/查明死因并不容易。通常存在多种疾病。如果患有癌症或艾滋病的人因 nCoV-19 感染肺炎,那么原因是什么?“死因”的抽样不是很清楚,成为分析的一部分。

只有当它们具有相似的基础时,统计数据才对比较有用。

  • 编辑1(这些数字以前不可用):我知道荷兰的情况,他们比较了报告的covid死亡人数和总死亡人数。他们发现每周约有 2000 人的死亡率增加,但报告的 covid-19 死亡病例数仅为每周约 1000 人。因此,关于 covid-19 的统计数据中可能遗漏了很多人(另一种解释可能是,这 2000 人中的那一半是 covid-19,而另一半是其他人,但这不太可能)。很多人没有出现在统计数据中,因为他们没有死在医院(而是死在自己家或疗养院)。

    我对这些数字的看法是,无处不在的电晕病例仪表板和计数器是脆弱而脆弱的,并且呈现出可疑(有偏见的)数字。当不同来源的数量不匹配时,基本依据是值得怀疑的。

    如果您确实想使用死亡率数字,那么更严格的总死亡率似乎是更好的数字(这意味着由于所有原因导致的死亡,而不仅仅是关于 covid-19 的报告)。但是这些数字通常不容易获得/呈现(至少不是公开的并且在当地范围内分层),就像荷兰的病例分布图一样

    经销荷兰 资料来源:中央局 voor Statistiek

    我一直在尝试为多个国家采购这种东西,但这并不容易。我想(希望)这可能会在国际层面上在幕后完成。例如euromomo 项目但我对此知之甚少,并怀疑这些数据大多是在国家层面汇总的(使其无用或至少不可能制作像上面这样的图像)但我也认为政府没有花时间让这些数字准确而是将时间浪费在电晕应用程序上。

  • 编辑 2:我知道牛津大学的一项研究完全使用了您使用死亡率的方法来估计患病率。

    问题是他们引入了一个参数,即处于危险中的人口比例,这是一个非常不确定的参数。该参数与引入指示病例和首次报告死亡之间的时间相结合,是当前死亡人数与总感染人口之间相对简单的转换。在这篇博文中进行了类似的计算,但没有贝叶斯的东西会更简单ρρ

    我个人对这些计算持怀疑态度。涉及到一些计算,这些计算看起来像是一种严格的方法。但实际上,它只是用一个因子来衡量当前的死亡人数,以估计当前感染/免疫的人数。确定比例因子所涉及的数字非常不确定和有偏差。感染人数的后验估计与先前估计的因素和首例指示病例与首例死亡之间的时间(以及其他因素,如增长率估计和潜伏期估计以及偏差)一样不确定在有关死亡人数的报告中……这是一团糟)ρ

旅行数据

该病毒主要通过网络不规则地传播。它在家庭、社区、工作场所/学校、村庄、聚集地、国家和大陆的不同尺度上以不同的方式分布。你可以看到病毒从大型节点/社区突然跳跃到大型节点/社区。

您可以使用这些节点/社区中病毒的出现作为变量(因此您不计算个体,因为我们不知道所有个体中的存在,而是计算社区中更广为人知的病毒存在),并且然后使用模型来了解病毒在网络中不同节点之间传播的动态。

例如。例如,在 A 地区,您在来自 B 地区的人中遇到 x 例疾病,在来自 C 地区的人中遇到 y 例疾病,而到这些地区的旅行是,然后估计B:C 区域中的病毒可以近似为 (x/r):(y/q)。rq

我记得早期有一篇关于 COVID-19 传播的文章(我相信是中国学者写的),试图估计并包含有关不同地区之间旅行频率的信息。R0


随机测试

您可以对未显示任何症状的人群样本进行测试,并使用该样本中的病毒流行率来估计整个人群的流行率。

如果流行率非常小,那么这需要非常大的样本,这可能很困难。在这种情况下,人们可以在怀疑流行率较高的样本中进行测试,并获得有关该组中有多少人感染病毒的一些信息。这种度量可用于根据不完整的信息来校准估计值(即,连同其他信息,例如病毒感染者出现特定轻微或严重症状的比率,您可以了解当前估计值有多少低估了真实病例数)。

  • 编辑 3 到目前为止,已经有一些此类放映。例如:

    当更多这些结果出现时,我们能够对疾病的空间分布和患病率做出更加严格的估计。

似乎有一篇博客文章也处理了这个问题。

如果您所在地区有死亡病例,您可以使用它来猜测当前真实病例的数量。我们知道该人从感染病毒到平均死亡大约需要多长时间(17.3 天)。这意味着 2 月 29 日在华盛顿州死亡的人可能在 2 月 12 日左右被感染。然后,你知道死亡率。对于这种情况,我使用 1%(我们稍后会讨论详细信息)。这意味着,在 2/12 左右,该地区已经有大约 100 例病例(其中只有 1 例在 17.3 天后死亡)。现在,使用冠状病毒的平均倍增时间(平均病例倍增所需的时间)。这是6.2。这意味着,在此人死亡的 17 天内,病例数必须乘以 ~8 (=2^(17/6))。这意味着,如果您不诊断所有病例,那么今天的 1 例死亡意味着今天有 800 例真实病例。

这是另一个具有类似估算方法的仪表板:

从死亡中估计受感染的人口