我正在尝试对R 中明显分散不足的计数数据进行建模(分散参数 ~ .40)。这可能就是为什么glm
带有family = poisson
或负二项式 ( glm.nb
) 模型不显着的原因。当我查看数据的描述时,我没有典型的计数数据偏斜,而且我的两个实验条件下的残差也是同质的。
所以我的问题是:
如果我的计数数据不像计数数据,我是否甚至必须对计数数据使用特殊的回归分析?我有时会面临非正态性(通常是由于峰态),但我使用百分位自举法来比较修剪后的平均值(Wilcox,2012)来解释非正态性。计数数据的方法可以用 Wilcox 建议并在 WRS 包中实现的任何稳健方法替代吗?
如果我必须对计数数据使用回归分析,我该如何解释分散不足?泊松分布和负二项分布假设了更高的离散度,所以这不合适,对吧?我正在考虑应用准泊松分布,但通常建议过度分散。我在 R 的包中读到了似乎能够解释过度分散和欠分散的beta-二项式
VGAM
模型。然而,作者似乎推荐使用波浪形泊松分布,但我在包中找不到它.
任何人都可以推荐一个用于分散数据的程序,并可能提供一些示例 R 代码吗?