零膨胀模型 - “真零”与“超零”

机器算法验证 泊松分布 零通胀
2022-03-19 07:47:32

我正在尝试确定零膨胀泊松是否适合我的数据与泊松障碍模型。

在两者之间的背景阅读中,我遇到了一个声明,说零膨胀模型试图区分真零和过度零。我在理解这两个零之间有什么不同时遇到了问题。

谁能解释这两种类型的零在零膨胀建模的背景下意味着什么?

3个回答

我只知道我读过的内容,但我相信不同之处在于,多余的零是不可能发生任何事件的零,而真正的零发生在可能发生事件但没有发生的情况下。例如,人们走进银行:在营业时间,可能有一段时间零客户进入银行(真正的零),但是当银行关门时,您总是会得到零(超零),因为银行关闭的时间比打开的时间多,你会得到很多多余的零。

Zuur 等人的书《Mixed Effects Models and Extension in Ecology with R》提供了对各种 ZIP 模型的广泛解释。他们声明“由于设计、调查或观察者错误导致的零点……称为假零点或假阴性[或者,我相信,你所说的多余零点]。在完美的世界中,我们不应该拥有它们。结构零点称为正零点、真零点或真负点。” (第 271 页)。他们继续讨论障碍模型如何以不同于零膨胀模型的方式处理这些不同类型的零。

我认为这是两种分布的混合。多余零点是指超出特定过程(例如泊松或负二项式)可能产生的零点。因此,数据中存在一定概率的零,如果不是零,那么它的值由过程(例如泊松或负二项式)控制,当然它也可能再次为零。如果我不在基地,我很好奇,我相信有人会指出这一点。