激励在超额死亡率估计中使用贝叶斯样条

机器算法验证 时间序列 推理 生物统计学 样条 死亡
2022-04-04 00:35:10

我正在阅读这篇论文,估计由大流行引起的超额死亡。也就是说,粗略地说,它构建了一个模型,使用历史死亡率数据来估计如果没有发生大流行,将会发生多少死亡(各种原因)。然后,它将这一预测推算到 2021 年,并将该预测与实际发生的死亡人数(当然,大流行确实发生的地方)进行比较。用于预期全因死亡率的模型是贝叶斯样条。现在,我是一名本科生,知道什么是贝叶斯推理,什么是样条曲线,但不知道贝叶斯样条曲线是什么。我将概述模型,只是想知道为什么这适用于此设置,而不是简单的样条曲线(分段多项式回归)拟合历史上随时间推移的死亡人数。

论文中的模型有死亡,由给出,其中,其中是该国的人口,是时间。对我来说,这是一个层次模型,其中每周的死亡人数(比如每周索引时间)是一个随机事件分布的泊松(不清楚为什么我们不只是回归到样条直线上升)。然后选择泊松率参数,我们使用指数模型(我不清楚为什么);包括似乎是明智的,因为死亡人数将与人口成正比,我们想对此进行纠正,但我不太明白其中的样条曲线ddPoisson(μ)μExp(logp+spline(t))ptlogp指数正在确定速率参数。有人可以解释为什么这是一个合理的、有动机的特定时间点死亡模型吗?或者只是广泛地激发我猜是“贝叶斯样条”的东西?谢谢!

1个回答

死亡率不能为负(大流行很糟糕,但它不是僵尸启示录),因此执行此操作的一种自然方法是在对数尺度上拟合一个加法/线性模型(因此该模型具有偏移量而不仅仅是 ),然后通过 log 的倒数,即指数函数logpp[0,]

这是 GLM 的常用公式,其中log将是链接功能和exp它的逆。

作者并没有真正解释贝叶斯样条的含义;通常在这种框架中,我们选择给定大小的样条基,然后使用惩罚拟合来缩小样条的系数,以最小化惩罚拟合标准,并对估计的样条的摆动进行惩罚。在贝叶斯上下文中,这个惩罚可以被认为是样条曲线摆动的先验,也可以被认为是系数(IIRC)的高斯先验。