解释零通胀负二项式模型

机器算法验证 混合模式 负二项分布 零通胀 glmmtmb
2022-03-15 07:31:16

我目前正在运行一系列零膨胀负二项式模型,研究各种天气参数的变化幅度和方向对昆虫行为的影响(表示为在设定的时间段内记录行为的次数)曝光后的时间)。我目前的模型正在检查生育力,如下所示。随机效应都是分类的,并且对应于记录行为的日期和实验室中雄性的饲养条件。

model2<-glmmTMB(No.eggs.laid~Change.6hrs*Direction.6hrs + (1|Day) + (1|Sex.ratio.line.male), family = "nbinom1",ziformula = ~Change.6hrs*Direction.6hrs + (1|Day) + (1|Sex.ratio.line.male), data = charlotte.egg)

这是我的模型的摘要输出:

Family: nbinom1  ( log )
Formula:          
No.eggs.laid ~ Change.6hrs * Direction.6hrs + (1 | Day) + (1 |  
    Sex.ratio.line.male)
Zero inflation:                
~Change.6hrs * Direction.6hrs + (1 | Day) + (1 | Sex.ratio.line.male)
Data: charlotte.egg

     AIC      BIC   logLik deviance df.resid 
  2980.0   3033.3  -1477.0   2954.0      430 

Random effects:

Conditional model:
 Groups              Name        Variance  Std.Dev. 
 Day                 (Intercept) 1.316e-02 1.147e-01
 Sex.ratio.line.male (Intercept) 8.032e-10 2.834e-05
Number of obs: 443, groups:  Day, 7; Sex.ratio.line.male, 10

Zero-inflation model:
 Groups              Name        Variance Std.Dev.
 Day                 (Intercept) 0.58920  0.7676  
 Sex.ratio.line.male (Intercept) 0.01893  0.1376  
Number of obs: 443, groups:  Day, 7; Sex.ratio.line.male, 10

Overdispersion parameter for nbinom1 family (): 5.42 

Conditional model:
                                   Estimate Std. Error z value
(Intercept)                         2.92753    0.11709  25.003
Change.6hrs                        -0.26768    0.12984  -2.062
Direction.6hrsIncrease             -0.06377    0.13621  -0.468
Change.6hrs:Direction.6hrsIncrease  0.23991    0.15250   1.573
                                   Pr(>|z|)    
(Intercept)                          <2e-16 ***
Change.6hrs                          0.0392 *  
Direction.6hrsIncrease               0.6397    
Change.6hrs:Direction.6hrsIncrease   0.1157    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Zero-inflation model:
                                   Estimate Std. Error z value
(Intercept)                         -0.9118     0.6278  -1.452
Change.6hrs                         -2.9058     1.3911  -2.089
Direction.6hrsIncrease              -0.8555     0.6355  -1.346
Change.6hrs:Direction.6hrsIncrease   3.3083     1.4543   2.275
                                   Pr(>|z|)  
(Intercept)                          0.1464  
Change.6hrs                          0.0367 *
Direction.6hrsIncrease               0.1783  
Change.6hrs:Direction.6hrsIncrease   0.0229 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

关于这个模型的输出,我有几个问题:

  1. 零通胀模型实际上代表什么?
  2. 这些 p 值是否足以解释模型,或者是否需要完成进一步的显着性统计检验才能推断变量之间的关系?
  3. 使用这种类型的模型,您将如何确定随机效应的重要性?对于非零膨胀模型,我可以通过使用 anova() 函数来比较具有和不具有特定随机效应的模型,但是当我尝试这样做时,只会生成一个 p 值。因此,我不确定这是否与有条件或零通胀模型有关。
1个回答
  1. 零通胀模型实际上代表什么?

这是非零与零发生的模型。它可以解释为与逻辑回归模型相同的解释,其中成功意味着非零计数,并且您正在对获得非零计数的概率进行建模。

  1. 这些 p 值是否足以解释模型,或者是否需要完成进一步的显着性统计检验才能推断变量之间的关系?

尝试解释系数估计值,而不是 p 值,但是是的,p 值可以解释为观察这些数据的概率,或者如果原假设为真,则数据更极端。也就是说,每个 p 值都与特定零假设的特定检验相关,这是您可以解释 p 值的唯一上下文。

  1. 使用这种类型的模型,您将如何确定随机效应的重要性?对于非零膨胀模型,我可以通过使用 anova() 函数来比较具有和不具有特定随机效应的模型,但是当我尝试这样做时,只会生成一个 p 值。因此,我不确定这是否与有条件或零通胀模型有关。

同样,不要太担心这些测试中的 p 值。您有重复的措施,因此您正在使用随机截距来解决这个问题。报告这些随机截距的方差就足够了。在您的情况下,您可以注意到模型两个部分中这些方差分量之一的方差与另一个相比很小。话虽如此,寻找一个简约模型是很好的,所以如果你有理由相信你的任何一个分组变量对于模型的任何一部分都不应该有任何相关性,那么你可以从以与没有零通货膨胀的模型相同的方式建模并执行似然比检验 - 请注意,模型有 2 个部分包含随机效应:主要部分和ziformula部分。