是否可以比较模型拟合高斯与二项式 glm

机器算法验证 广义线性模型 模型选择
2022-04-15 08:36:10

我正在使用二项式 GLM 对一些比例数据进行建模 - 即拟合值是 sigmoidal - 但数据看起来可能更适合直线(简单线性模型的模型验证图表明这也可以)。

有没有办法比较这些模型,看看一个是否比另一个更适合?我正在使用 r,最初认为我可以使用

m1 <- glm(y ~ x, family = gaussian)

m2 <- glm(y ~ x, family = binomial)

然后使用 AIC 进行比较。(请注意,协变量对于m1&是相同的m2)。

但是,我已经意识到这两个模型需要以不同的方式构造响应变量 - 作为 中的比例m1,以及包含“成功”和“失败”列的矩阵m2我认为(?)这意味着这种方法是不合适的。

有没有一种方法可以测试一个模型是否比另一个模型更适合数据?

谢谢您的帮助!

周杰伦

我还应该注意 - 就我对关系的理解而言,除了二项式误差适用于比例数据这一事实之外,没有理论上的理由选择 S 型关系而不是简单的线性关系。

1个回答

首先,您可以尝试观察残差,看看一个或其他模型是否使它们更均匀,但我怀疑鉴于您还没有看到明确的赢家,这也不会分裂它们。

在这种情况下,我认为这真的归结为您对“更好”的定义。因为您对两个模型使用相同的解释变量,以及相同数量的参数等,所以只需比较两个模型的拟合优度即可。你只需要定义你所说的合适的意思。

例如,如果您的实用程序是最小化预测的均方误差,那么选择最能做到这一点的模型——应该是高斯模型。另一方面,如果您想要最小化均方对数赔率误差的那个,那么选择做得最好的那个(这应该是二项式)。当然,由于您出于经验实用的原因选择模型,因此您不必局限于此。您可以选择最小化卡方误差的模型,或者更奇特的模型。

安装后,您打算将模型用于什么用途?当模型错误时,您真的想考虑模型用户的成本是多少。

这在精神上与这个关于成本函数的问题有关:用于验证泊松回归模型的成本函数