解释零膨胀负二项式回归

机器算法验证 回归 解释 负二项分布 零通胀
2022-03-09 03:33:42

我试图用 11 个预测变量和报告的犯罪数量作为响应变量来估计一个零膨胀负二项式模型。该模型似乎工作正常,但我不确定如何解释结果。以下是我的模型和结果:

#estimate zero-inflated NB model 
zinf.nbi <- zeroinfl(CRIME ~ VAR1 + VAR2 + VAR3 + VAR4
                + VAR5 + VAR6 + VAR7 + VAR8 + VAR9 + VAR10
                + VAR 11, data = mydata, dist = "negbin")
summary(zinf.nbi)

> summary(zinf.nbi)

Call:
zeroinfl(formula = CRIME ~ VAR1 + VAR2 + VAR3 + VAR4 + VAR5 
         + VAR6 + VAR7 + VAR8 + VAR9 + VAR10 + VAR 11, 
         data = mydata, dist = "negbin")

Pearson residuals:
    Min       1Q   Median       3Q      Max 
-0.47719 -0.17583 -0.08080 -0.02709 26.99868 

Count model coefficients (negbin with log link):
              Estimate Std. Error z value Pr(>|z|)    
(Intercept)  -2.682578   0.269317  -9.961  < 2e-16 ***
VAR1          1.436770   0.249026   5.770 7.95e-09 ***
VAR2         -0.648535   0.268608  -2.414 0.015760 *  
VAR3         -0.130107   0.239543  -0.543 0.587029    
VAR4         -0.008985   0.267949  -0.034 0.973249    
VAR5         -0.807941   0.269470  -2.998 0.002715 ** 
VAR6         -1.396990   0.396299  -3.525 0.000423 ***
VAR7          0.314514   0.113696   2.766 0.005670 ** 
VAR8         -1.959792   0.207233  -9.457  < 2e-16 ***
VAR9          0.711452   0.338171   2.104 0.035394 *  
VAR10        -0.013628   0.132889  -0.103 0.918316    
VAR11         0.092719   0.034799   2.664 0.007712 ** 
Log(theta)   -1.429807   0.103981 -13.751  < 2e-16 ***

Zero-inflation model coefficients (binomial with logit link):
             Estimate Std. Error z value Pr(>|z|)    
(Intercept)   1.14267    0.46786   2.442 0.014593 *  
VAR1          1.13108    0.51718   2.187 0.028742 *  
VAR2         -0.68871    0.33832  -2.036 0.041781 *  
VAR3          0.16412    0.37019   0.443 0.657527    
VAR4          0.57907    0.42818   1.352 0.176241    
VAR5          0.83822    0.40451   2.072 0.038247 *  
VAR6          0.02991    0.73117   0.041 0.967368    
VAR7          0.01186    0.19025   0.062 0.950282    
VAR8         -1.33618    0.39677  -3.368 0.000758 ***
VAR9          1.40246    0.39349   3.564 0.000365 ***
VAR10        -0.14713    0.22707  -0.648 0.517000    
VAR11        -2.71317    0.64939  -4.178 2.94e-05 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Theta = 0.2394 
Number of iterations in BFGS optimization: 42 
Log-likelihood: -2649 on 25 Df

据我了解,第一个块(计数组件)是完整模型的总结,可以解释为标准的负二项式模型。另一方面,第二个块(零分量)预测结果是否为某个零。现在,我想知道的是:

a)我如何解释模型的第二个块与第一个块的关系?正如您在结果中看到的那样,一些变量在第一个和第二个块中都很重要。

b) 我应该在最终结果中显示哪个块?第一块还是第二块?

1个回答

a) 这里https://rpubs.com/kaz_yos/pscl-2是一个很好的例子,说明了如何解释 ZINB 模型的结果。

b) 很明显,您必须同时展示两个块。

注意:ZINB 回归对两个独立的过程进行建模,因此它们会产生两组系数:一组用于模型的计数部分,另一组用于模型的逻辑部分。

解释逻辑回归模型的一种常用方法是将系数取幂,这将系数置于优势比尺度中。对于零膨胀模型,模型的逻辑部分预测结果不会发生。

在这里您可以找到另一个示例https://stats.idre.ucla.edu/other/dae/