用分类数据解释负二项式 GLM 的 .L 和 .Q 输出

机器算法验证 r 分类数据 广义线性模型 解释 负二项分布
2022-02-14 17:11:25

我刚刚运行了一个负二项式 GLM,这是输出:

Call:
glm.nb(formula = small ~ method + site + depth, data = size.dat, 
    init.theta = 1.080668549, link = log)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.2452  -0.9973  -0.3028   0.3864   1.8727  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   1.6954     0.1152  14.720  < 2e-16 ***
method.L     -0.6828     0.1637  -4.171 3.04e-05 ***
site.L        0.9952     0.2050   4.854 1.21e-06 ***
site.Q       -0.4634     0.1941  -2.387    0.017 *  
depth.L       0.8951     0.1988   4.502 6.74e-06 ***
depth.Q       0.2060     0.1984   1.038    0.299    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for Negative Binomial(1.0807) family taken to be 1)

    Null deviance: 185.1  on 89  degrees of freedom
Residual deviance: 100.8  on 84  degrees of freedom
AIC: 518.24

我的预测都是分类的。这就是我得到.Land的原因.Q我认为它们代表不同的类别,但有谁知道我可以在运行 GLM 之前用来标记它们的代码,以便它们显示为不同的类别?

1个回答

您的变量不仅被编码为因子(使它们成为分类),它们还被编码为有序因子。然后,默认情况下,R 将一系列多项式函数拟合到变量的水平。第一个是线性的 ( .L),第二个是二次的 ( .Q),第三个(如果您有足够的级别)将是三次等。R 将拟合的多项式函数比变量中的级别数少一个。例如,如果您只有两个水平,则只有线性趋势适合。此外,所使用的多项式基是正交的。(对于它的价值,这些都不是 R 或负二项式模型所特有的 - 所有软件和回归模型类型都会做同样的事情。)


特别关注 R,如果您希望将变量编码为有序或无序,您将使用?factor

my.variable <- factor(my.variable, ordered=TRUE)   # an ordered factor
my.variable <- factor(my.variable, ordered=FALSE)  # an unordered factor