什么是 R rnbinom 负二项式色散参数?

机器算法验证 r 负二项分布 计数数据
2022-03-24 12:19:00

在 R 函数中,rnbinom参数之一是色散或形状参数。这可以参数化为 theta 或 alpha,具体取决于模型的编写方式。我不知道?rnbinom它的要求是什么。有人有想法吗?

编辑:我运行了一个简单的负二项式回归模型,并希望使用模型参数来生成模拟工作的理论分布。我不确定如何使用色散参数。这是R的输出:

摘要(glm.nb(exit~1+offset(log(stock)),data=d2))

Call:
glm.nb(formula = exit ~ 1 + offset(log(stock)), data = dt, init.theta = 5.855047422, 
    link = log)

Deviance Residuals: 
     Min        1Q    Median        3Q       Max  
-2.83778  -0.86369   0.00863   0.62604   1.80784  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   -3.689      0.029  -127.2   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for Negative Binomial(5.855) family taken to be 1)

    Null deviance: 218.61  on 211  degrees of freedom
Residual deviance: 218.61  on 211  degrees of freedom
AIC: 2297.5

Number of Fisher Scoring iterations: 1


              Theta:  5.855 
          Std. Err.:  0.582 

 2 x log-likelihood:  -2293.500 

我将使用 rnbinom 对分布进行建模,并将其作为参数:

x<-rnbinom(nrow(dt),size=5.855,mu=1/exp(-3.689))

我的问题是我是否适当地对 size 参数进行了参数化。应该是 5.855 还是 1/5.855?我或多或少地了解模型的不同参数化,如(或)或,从这里我知道 glm.nb 正在报告我不确定 rnbinom 正在寻找什么参数 - 我假设它是是否正确,我的代码在这里正确()。θrαθsizeθsize=5.855

2个回答

文档称其为“大小”

size   成功试验次数的目标,或分散参数(伽马混合分布的形状参数)。必须是严格正数,不必是整数。

这是理解它的最简单方法。负二项分布通常被理解为

在发生指定(非随机)失败次数(表示为 r)之前,在一系列独立且相同分布的伯努利试验中成功次数的离散概率分布。

换句话说,当进行一系列掷硬币时,你可以计算在你得到个正面之前你得到了多少个反面,硬币有个正面的概率。 rp

我最近在这个问题上遇到了麻烦,由于我在原始帖子的编辑中没有找到具体的答案,所以我将分享我的发现。

glm.nb函数估计一个色散参数,标记为这通常称为大小参数并用表示,如Negative Binomial Wikipedia 文章中所示。θr

rnbinom函数(带有文档)将 prob 和 size 作为参数,或者 mu 和 size,其中 mu 由 计算prob = size/(size+mu)

因此,该帖子在您想要的假设中是正确的:

x <- rnbinom(nrow(dt), size=5.855, mu=1/exp(-3.689))