我正在尝试在 GLM 框架内将哪种回归类型(几何、泊松、负二项式)与计数数据一起使用(8 个 GLM 分布中只有 3 个用于计数数据,尽管大多数我已经阅读了负二项分布和泊松分布的中心)。
何时对计数数据使用泊松、几何和负二项式 GLM?
到目前为止,我有以下逻辑:它是计数数据吗?如果是,均值和方差是否不相等?如果是,负二项式回归。如果不是,泊松回归。通货膨胀为零吗?如果是,零膨胀泊松或零膨胀负二项式。
问题 1似乎没有明确指示何时使用哪个。有什么可以告知这个决定吗?据我了解,一旦您切换到 ZIP,平均方差等于假设就会放松,因此它再次与 NB 非常相似。
问题 2在决定是否在回归中使用几何族时,几何族在哪里适合?或者我应该对数据提出什么样的问题?
问题 3我看到人们一直在交换负二项分布和泊松分布,但不是几何分布,所以我猜测何时使用它有一些明显不同。如果是这样,它是什么?
PS如果人们想评论/调整它以供讨论 ,我已经制作了一个(可能过于简化,来自评论)图表(可编辑)我目前的理解。