GLM 高斯 vs GLM 二项式 vs 对数链接 GLM 高斯

机器算法验证 广义线性模型
2022-04-10 08:33:48

我正在尝试对疟疾造成的死亡进行研究,以找到预测这种疾病有多危险的最佳方法。

我没有强大的统计学背景,我是一名自动学习者,使用在线课程积累知识。

首先,我以这种方式收集数据:

Statistics(gender, age, ..)   |   Number_Death

据我所知,我的选择是

  • 具有二项分布的 GLM:用于预测这是否危险。在这种情况下,我将预测变量标记为 0(没有死亡),1 代表一个或多个案例。

  • 具有泊松分布的 GLM:用于根据预测器预测事件的数量。

现在,我很困惑。我们将出于什么目的使用具有高斯分布的 GLM、具有高斯和对数链接函数的 GLM 或具有 Gamma 分布的 GLM?

1个回答

glm 包含三个组件。一个概率分布、一个线性预测器和一个链接函数,它将线性预测器与响应的概率分布的期望值相关联,我将其表示为首先,请注意,对于两个高斯模型,结果都是连续随机变量。Y

对于 GLM 高斯,我假设这具有默认的身份链接,因此的常规线性模型没有什么不同请注意,这种情况假设方差不变,因为的平均值随线性变化。E(Y)=XβYN(Xβ,σ2)YX

对于对数关联的 GLM 高斯,,所以 . 此示例可能是您询问的三个示例中最简洁的示例,这将有助于阐明这三个组件。链接是对数,线性预测是,概率分布是正态的。和响应之间非线性关系的一种非常特殊的函数形式的一种方法,尽管它仍然假设围绕均值的方差恒定。 log(E(Y))=XβE(Y)=eXβYN(eXβ,σ2)XβXeXβ

对于 GLM gamma,请参阅何时使用 gamma GLM?