如何解释负二项式回归模型中分类预测变量的系数?

机器算法验证 r 分类数据 回归系数 负二项分布 标准化
2022-03-28 08:54:16

我使用了一些分类变量作为负二项式模型的预测变量。因变量是数值的。我在 R 中使用了 glm.nb,结果显示了一个类别相对于另一个类别的相对系数。

然后我尝试使用 lm.beta 来标准化系数,但结果仍然是相对的。我如何在这里解释正系数与负系数?

1个回答

我将使用泊松模型来回答这个问题,它恰好是一个没有过度离散的负二项式模型,因为数学会更简单。泊松模型预测观察的概率yi是一个特定的非负离散数

P(yi|X)=exp(λi)λiyiyi!

此分布的条件均值λi.

E[yi|xi]=λi=exp(xiβ)
logλi=xiβ
泊松模型的条件方差也是λi,但负二项式模型的方差为λi+αλi. 就本答案而言,这是两个模型之间唯一的实际区别。

这实际上是一个对数线性模型。所以边际效应xλ可以显示为

E[y|x]x=λix=exp(β)

所以如果你有一个负面的β对于虚拟变量x,你可以说“平均而言,x降低期望值log(y)经过β*100%的。”