GAM 与 GLM:相同的拟合,预测变量的不同意义

机器算法验证 广义线性模型 广义加法模型
2022-04-03 01:15:30

当对同一数据集执行 GAM 和 GLM 拟合时,我在拟合指标方面得到了几乎相同的拟合。但是,两种方法之间被确定为显着的变量不同。如何决定哪种方法最合适?

1个回答

系数显着性不同的原因是,在建模假设下,标准误差的计算不同。正确的答案是选择最适合——而不是数据——手头的科学问题的模型。

例如,假设我有兴趣测量在实施某种干预之前和之后社区中某些疾病的发病率差异。我可以使用带有身份链接的 Poisson GLM 对附加率进行建模。这假定利率的分布遵循泊松分布。另一方面,我可以使用简单的 t 检验对这些比率进行建模。这没有对比率的分布进行假设,并考虑了由于社区内的感染而可能的分散不足,不一定具有恒定的到达间隔时间。这两个模型将估计相同的比率差异,但给出不同的标准误差。

那么,哪个是正确的呢?好吧,基础假设的充分性是值得质疑的。因此,您应该努力描述和合理化适用于数据的模型——无论该模型是否重要。