在 R 中拟合广义线性模型 (GLM)

机器算法验证 r 广义线性模型 链接功能
2022-04-14 19:21:37

我正在学习广义线性模型和 R 统计包的使用,但不幸的是,我无法理解一些基本概念。

我正在尝试开发 GLM - Poisson 模型,但使用特定的日志链接功能。该函数的形式为

ln(E(yi))=ln(β1)+β2ln(exp1)+β3ln(exp2).

在这个等式中,是模型中曝光的度量。据我了解,在 R 中,我会首先加载所有数据并确保其设置正确。然后我相信我应该跑步:exp1exp2

model = glm(formula = Y~exp1+exp2, family=poisson(link="log"),data=CSV_table)

由于我是 GLM 和 R 的新手,因此我不确定指定 poisson(link="log") 的作用。我希望这个问题不会太琐碎。几个小时以来,我一直在尝试在网上搜索清晰简洁的解释;然而,许多答案/链接假设的知识水平高于我的水平。

1个回答

GLM 包含三个组成部分:结果变量、线性预测变量和链接函数。GLM 中的链接函数将结果变量的期望值与线性预测变量相关联。换句话说,不是期望值本身,而是它的函数由线性预测器建模。以对数作为链接函数和线性预测器的示例是:β0+β1x

log(E(y))=β0+β1x

在您的情况下,线性预测器是因此,您的模型的方程变为:log(β0)+β1log(exp1)+β2log(exp2)

log(E(y))=log(β0)+β1log(exp1)+β2log(exp2)

我认为这有点奇怪,我认为这可能不是您应该适合的模型。无论如何,要使用 R 来拟合这个模型,代码应该如下所示:

model <- glm(formula = Y ~ log(exp1) + log(exp2), family = poisson(link="log"), 
             data = CSV_table)

如果要将截距写为日志,则运行模型后唯一需要注意的是获取截距的指数函数。如果您想了解 GLM 和一般的分类数据分析,一本好书是 Agresti (2007) 的书。

参考:

Agresti, A. (1996)。分类数据分析简介(第 135 卷)纽约:威利。