我正在尝试对疟疾造成的死亡进行研究,以找到预测这种疾病有多危险的最佳方法。
我没有强大的统计学背景,我是一名自动学习者,使用在线课程积累知识。
首先,我以这种方式收集数据:
Statistics(gender, age, ..) | Number_Death
据我所知,我的选择是
具有二项分布的 GLM:用于预测这是否危险。在这种情况下,我将预测变量标记为 0(没有死亡),1 代表一个或多个案例。
具有泊松分布的 GLM:用于根据预测器预测事件的数量。
现在,我很困惑。我们将出于什么目的使用具有高斯分布的 GLM、具有高斯和对数链接函数的 GLM 或具有 Gamma 分布的 GLM?