负二项式“过程”

机器算法验证 r 回归 泊松分布 负二项分布
2022-03-03 19:38:36

我希望模拟由软件开发引起的错误数量。这在直觉上有点像泊松过程,但是它是过度分散的。在这种情况下,我们可以做的一件事是使用负二项分布(因为负二项式会随着泊松r变大,或者因为我们可能认为泊松的参数本身是伽马分布的。)λ

我不确定如何做到这一点。例如,我们有 给定一个泊松持续时间t的过程可以建模为\text{Poisson}(\lambda t)我想我们可以看看NB\left(r,\frac{\lambda t}{\lambda t+r}\right) - 是正确的?鉴于我知道t,看来我应该设置r=t

limrNB(r,λλ+r)=Poisson(λ)
tPoisson(λt)NB(r,λtλt+r)tr=t

在更技术的层面上,glm.nbMASS包装上看似乎不适合r参数,我没有看到明显的参数来改变它。

任何理论或技术层面的见解都将不胜感激。

1个回答

几个随机过程导致边际计数具有负二项式 (NB) 分布,因此可以称为NB 过程其中,NB Lévy 过程特别令人感兴趣,因为非重叠时间间隔上的增量(计数)是独立的,与 Poisson 过程、Gamma 过程和 Wiener 过程共享的属性。长度为t的区间上的计数N_t具有 NB 分布 N_t \sim \textrm{NB}(r,\,p), \quad r = \gamma t 因此该过程取决于两个参数\gamma >0(其中反时限的维数)和概率p ( 0 < p < 1Ntt

NtNB(r,p),r=γt
γ>0p0<p<1)。期望与区间长度成正比,它的方差
E(Nt)=γt(1p)/pVar(Nt)=γt(1p)/p2.
方差大于均值(过度离散),离散指数Var(Nt)/E(Nt)=1/p不依赖于tp接近1γ(1p) 接近λ>0时,该过程的行为类似于速率为λ的泊松过程。过度离散的一个解释是多个事件可能同时发生,因此一个小的间隔可以包含多个事件。

当区间长度不同时,通过最大似然法很容易拟合这样的过程。在这种情况下,我们面临一个 NB 回归,其链接函数与 NB GLM 中的默认链接不同。特殊的似然最大化是有用的。

TJ Kozubowski 和 K. Podgorski的文章提供了理论结果和说明。

奇怪的是,统计学家似乎并不经常使用这个过程。