通用线性模型与广义线性模型(带有恒等链接函数?)

机器算法验证 广义线性模型 造型 线性模型
2022-02-07 12:17:29

我的问题主要涉及通用线性建模(GLM)和广义线性建模(GZLM)之间的实际差异。

在我的情况下,与 GZLM 相比,它将是一些作为协变量的连续变量和 ANCOVA 中的一些因素。我想检查每个变量的主要影响,以及我将在模型中概述的一种三向交互作用。我可以看到这个假设正在 ANCOVA 或使用 GZLM 中进行测试。在某种程度上,我了解运行像 ANCOVA 这样的一般线性模型背后的数学过程和推理,并且我有点理解 GZLM 允许连接线性模型和因变量的链接函数(好吧,我撒谎了,也许我没有真的懂数学)。

我真正不明白的是,当 GZLM 中使用的概率分布是正常的(即身份链接函数?)时,运行一种分析而不是另一种分析的实际差异或原因。当我在另一个上运行时,我得到了非常不同的结果。我也可以跑吗?我的数据有些不正常,但在一定程度上在 ANCOVA 和 GZLM 中都有效。在这两种情况下,我的假设都得到支持,但在 GZLM 中,p 值“更好”。

我的想法是 ANCOVA 是一个线性模型,具有使用恒等链接函数的正态分布因变量,这正是我可以在 GZLM 中输入的,但这些仍然不同。

如果可以的话,请为我解答这些问题!


根据第一个答案,我还有一个问题:

如果除了它使用的显着性检验(即 F 检验与 Wald Chi Square)之外它们是相同的,那么哪个最适合使用?ANCOVA 是“首选方法”,但我不确定为什么 F 检验更可取。有人可以为我解释一下这个问题吗?

2个回答

指定恒等链接函数和正态族分布的广义线性模型与(一般)线性模型完全等价。如果你从每一个中得到明显不同的结果,那么你做错了什么。

请注意,指定身份链接指定正态分布不同。分布和链接函数是广义线性模型的两个不同组成部分,并且可以相互独立地选择每个部分(尽管某些链接在某些分布下效果更好,因此大多数软件包都指定了每个分布允许的链接选择)。

如果使用所有广义线性模型的渐近正态和卡方分布计算剩余自由度,某些软件包可能会报告明显不同所有软件都将根据学生分布和 Fisher 的值,因为这些对于较小的剩余自由度更准确,因为它们不依赖于渐近线。学生的 - 和 Fisher 的 -分布仅对正常家庭严格有效,尽管其他一些pptFtF广义线性模型的软件在使用从数据估计的尺度参数拟合其他族时,也可以使用这些作为近似值。

我想在这次讨论中加入我的经验。我已经看到,仅当您使用最大似然估计作为尺度参数方法时,广义线性模型(指定恒等链接函数和正态族分布)才与一般线性模型相同。否则,如果选择“固定值 = 1”作为比例参数方法,您将获得非常不同的 p 值。我的经验表明,通常应该避免“固定值 = 1”。我很想知道是否有人知道何时适合选择固定值 = 1 作为比例参数方法。提前致谢。标记