零截断泊松和基本泊松是嵌套的还是非嵌套的?

机器算法验证 泊松回归 零通胀
2022-03-15 17:13:23

我已经看到很多讨论基本泊松回归是否是零膨胀泊松回归的嵌套版本。例如,这个网站认为它是,因为后者包含额外的参数来模拟额外的零,但在其他方面包含与前者相同的泊松回归参数,尽管该页面确实包含不同意的参考。

我找不到关于零截断泊松和基本泊松是否嵌套的信息。如果零截断泊松只是一个泊松,并额外规定零计数的概率为零,那么我想听起来可能是这样,但我希望有一个更明确的答案。

我想知道的原因是它会影响我应该使用 Vuong 检验(对于非嵌套模型)还是基于对数似然差异的更基本的卡方检验(对于嵌套模型)。

Wilson (2015)讨论了 Vuong 检验是否适合将零膨胀回归与基本回归进行比较,但我找不到讨论零截断数据的来源。

2个回答

现在才遇到这个。为了避免混淆,我是原始问题中引用的 Wilson of Wilson(2015),它询问 Poisson 和截断 Poisson 模型是否是嵌套的、非嵌套的等。稍微简化一下,如果较大的模型,较小的模型将嵌套在较大的模型中如果其参数的子集固定在规定的值,则模型会缩减为较小的模型;如果两个模型在各自参数的子集固定为特定值时都归结为同一模型,则它们是重叠的,如果无论参数如何固定,一个都不能归结为另一个,则它们是非嵌套的。根据这个定义,截断泊松和标准泊松是非嵌套的。然而,这一点似乎被许多人忽视了,Vuong 的分配理论指的是严格嵌套,严格非嵌套,并且严格重叠。“严格”指的是在嵌套等的基本定义中添加了六个限制。这些限制并不完全简单,但它们确实意味着 Vuong 关于对数似然比分布的结果不适用于以下情况模型/分布嵌套在参数空间的边界(就像泊松/零膨胀泊松与零膨胀参数的恒等链接的情况一样),或者当一个模型倾向于另一个模型时,当参数趋于无穷时,如当使用 logit 链接对零膨胀参数建模时,泊松/零膨胀泊松就是这种情况。Vuong 没有提出关于在这些情况下对数似然比分布的理论。不幸的是,这里

以下 R 代码将模拟泊松分布和截断泊松对数似然比。它需要VGAM软件包。

n<-30   
lambda1<-1
H<-rep(999,10000)
for(i in 1:10000){
  print(i)
  y<-rpospois(n, lambda1)
  fit1 <- vglm(y ~ 1, pospoisson)
  fit2<-glm(y~1, family=poisson(link="log"))
  H[i]<-logLik(fit1)-logLik(fit2)
}

hist(H,col="lemonchiffon")

基本的泊松可以被认为是嵌套在更一般的形式中:

p(x)=(1p)eλλxx!+p1(x=0)

时,我们有基本的泊松。时,我们有零截断泊松。时,我们有一个零约泊松。时,我们有一个零膨胀泊松,并且我们在处有一个退化分布。p=0p=exp{λ}/(1exp{λ})exp{λ}/(1exp{λ})<p<00<p<1p=1

因此,在我看来,Vuong 测试的嵌套版本,或者您建议的卡方,在您的情况下是合适的。但请注意,由于“大”(相对于)观测值的概率较小,卡方可能会出现问题。您可能希望使用引导程序来获取卡方统计量的 p 值,而不是依赖渐近线,除非您有大量数据。λ