我想测试哪种回归最适合我的数据。我的因变量是一个计数,并且有很多零。
我需要一些帮助来确定使用什么模型和系列(泊松或准泊松,或零膨胀泊松回归),以及如何测试假设。
- 泊松回归:据我了解,强有力的假设是因变量均值 = 方差。你如何测试这个?他们必须离得有多近?是否使用无条件或条件均值和方差?如果这个假设不成立,我该怎么办?
- 我读到,如果方差大于平均值,我们就有过度离散,解决这个问题的一种潜在方法是包括更多的自变量,或者 family=quasipoisson。此分布是否有任何其他要求或假设?我使用什么测试来查看(1)或(2)是否更适合 - 简单
anova(m1,m2)
? - 我还读到当出现过度分散时可以使用负二项分布。我如何在 R 中做到这一点?与准泊松有什么区别?
零膨胀泊松回归:我读到使用 vuong 测试检查哪些模型更适合。
> vuong (model.poisson, model.zero.poisson)
那是对的吗?零膨胀回归有哪些假设?
加州大学洛杉矶分校的学术技术服务统计咨询小组有一个关于零膨胀泊松回归的部分,并根据标准泊松模型 (b) 测试零膨胀模型 (a):
> m.a <- zeroinfl(count ~ child + camper | persons, data = zinb)
> m.b <- glm(count ~ child + camper, family = poisson, data = zinb)
> vuong(m.a, m.b)
我不明白| persons
第一个模型的部分做了什么,以及为什么你可以比较这些模型。我曾期望回归是相同的,只是使用不同的家庭。