泊松回归如何处理零点?

机器算法验证 泊松回归 对数
2022-04-10 14:46:05

如果我错了,请纠正我。泊松回归的常用链接函数是 log,因此您正在对 log(y)~x1+x2+x3+x4+... 执行回归

变量 y 通常是一个计数,这意味着它仅限于从 0 到正无穷大的整数。输入变量 x1...xn 不限于正整数。

那么当 y = 0 时,回归是如何进行的呢?log(0) 只是被忽略了吗?

另外,需要明确的是,这个问题不是关于零膨胀泊松回归(它区分不同种类的零)。

2个回答

泊松模型是

y=exp(α+βx+ε).

你得到零结果的方式是当索引α+βx+ε是大而负的。这些系数不是来自对协变量的记录结果的回归,而是来自对数似然的最大化。您也可以在非整数结果上使用此模型,尽管这更具争议性。

您可以从这篇博文中了解有关此模型的更多信息,包括零点问题以及与记录结果回归的比较。

泊松回归模型是期望值的对数可以通过预测变量的线性组合来建模。y 的期望值不是 0,即使实际数据中可能有 0 个计数。期望是一个正实数。