过度离散参数

机器算法验证 r 负二项分布 计数数据 泊松回归 过度分散
2022-03-24 06:27:58

我正在使用计数模型对零截断过程进行建模,并试图确定数据是否过度分散。泊松分布的方差等于其均值, 负二项式模型通过估计过度离散参数这种方法有两种方案, 我经常看到第二个版本。我估计了三个具有相同协变量但具有三个不同链接函数()的模型。

Var(y)=E(y)=λ
αNB1
Var(y)=λα
NB2
Var(y)=λ(1+λ/α)
PoissonNB1NB2

Model   logLik   alpha  p(alpha)
Poisson -7942    1      NA
NB1     -6399    1.001  0
NB2     -7944    403.4  0

显然,过度分散参数很重要,因此我应该使用其中一个NB模型。但是,当模型中有附加参数时,对数似然怎么可能NB2低于呢?Poisson

当我估计所有三个模型时,我得到一个警告,我的方差-协方差矩阵可能不是半正定的。但是我没有高度共线的变量,并且所有相关矩阵都有严格的正特征值,所以我不明白为什么我会收到这个警告。这可能与可能性问题有关吗?

我正在使用同名glmmadmb中的函数。R

1个回答

你是对的,NB2 模型不应该比泊松模型更差,因为后者是前者的特例,其中肯定有问题。在我看来,您的数值最大似然最大化器与您的规范有问题,因此并没有真正达到全局最大值。α=0

现在我不使用R,但是在Stata中NB2模型经常会出现收敛问题。Stata 有一个“困难”选项,它使用不同的算法从似然函数的非凹区域跳转。使用它通常可以解决问题。也许 R 也为您的最大化器提供了不同的选项;也许,您可以尝试不同的起始值,看看是否会有所不同。