当模型似然不显着高于空值时(GAM)回归系数的显着性

机器算法验证 非线性回归 无游戏
2022-03-28 01:12:58

我正在使用 R 包gamlss运行基于 GAM 的回归,并假设数据的 beta 分布为零膨胀。我的模型中只有一个解释变量,所以它基本上是:mymodel = gamlss(response ~ input, family=BEZI).

该算法给了我系数k对于解释变量对均值的影响(μ) 和相关的 p 值k(input)=0, 就像是:

Mu link function:  logit                                               
Mu Coefficients:                                                      
              Estimate  Std. Error  t value   Pr(>|t|)                  
(Intercept)  -2.58051     0.03766  -68.521  0.000e+00                  
input        -0.09134     0.01683   -5.428  6.118e-08

正如你在上面的例子中看到的,假设k(input)=0被高信心拒绝。

然后我运行空模型:null = gamlss(response ~ 1, family=BEZI)并使用似然比检验比较可能性:

p=1-pchisq(-2*(logLik(null)[1]-logLik(mymodel)[1]), df(mymodel)-df(null)).

在许多情况下,我得到p>0.05即使据报道输入的系数非常重要(如上所述)。我觉得这很不寻常——至少在我使用线性或逻辑回归的经验中从未发生过(事实上,当我将零调整伽马与 gamlss 一起使用时,这也从未发生过)。

我的问题是:在这种情况下,我还能相信响应和输入之间的依赖关系吗?

1个回答

我看不出这应该与 GAM 相关的直接原因。事实是您对同一件事使用了两个测试。由于统计数据没有绝对的确定性,很可能有一个给出显着的结果而另一个没有。

也许这两个测试中的一个更强大(但可能依赖于更多的假设),或者可能一个重要的测试是你的二十分之一的 I 型错误。

一个很好的例子是测试样本是否来自相同的分布:你有非常参数化的测试(T 检验可以用于这个:如果平均值不同,分布也应该不同),还有非参数的一个:可能会发生参数化的结果显着而非参数化的结果不显着的情况。这可能是因为参数检验的假设是错误的,因为数据只是非常特殊(I 型),或者因为样本量不足以使非参数检验发现差异,或者最后因为您真正想要测试的(不同的分布)由不同的测试检查是不同的(不同的意味着<->“高于”的机会)。

如果一个测试结果显示显着结果,而另一个只是稍微不显着,我不会太担心。