非线性与广义线性模型:您如何引用逻辑、泊松等回归?

机器算法验证 物流 广义线性模型 泊松回归 非线性 链接功能
2022-02-15 05:43:17

我有一个关于语义的问题,希望得到其他统计学家的意见。

我们知道诸如逻辑、泊松等模型属于广义线性模型的范畴。该模型包括参数的非线性函数,进而可以通过使用适当的链接函数使用线性模型框架对其进行建模。

我想知道您是否考虑(教?)逻辑回归等情况:

  1. 非线性模型,给定参数的形式
  2. 线性模型,因为链接将我们转换为线性模型框架
  3. 同时(1)和(2):它“开始”是一个非线性模型,但可以以允许我们将其视为线性模型的方式进行处理

希望我可以设置一个实际的民意调查...

1个回答

这是一个很好的问题。

我们知道诸如逻辑、泊松等模型属于广义线性模型的范畴。

嗯,是的,也不是。鉴于问题的上下文,我们必须非常小心地说明我们在谈论什么——单独的“逻辑”和“泊松”不足以描述预期的内容。

(i) “泊松”是一个分布。作为条件分布的描述,它不是线性的(因此不是 GLM),除非您指定一个线性(参数)模型来描述条件均值(即仅说“泊松”是不够的)。当人们指定“泊松回归”时,他们几乎总是打算使用参数线性的模型,因此是 GLM 但是仅“泊松”就可以是任意数量的事物*。

(ii) 另一方面,“逻辑”是指对均值的描述(均值在预测变量中是逻辑的)。它不是 GLM,除非你将它与指数族的条件分布结合起来。另一方面,当人们说“逻辑回归”时,他们几乎总是指具有 logit 链接的二项式模型——这确实意味着预测变量是逻辑的,模型在参数上是线性的并且在指数族中,GLM 也是如此。

该模型包括参数的非线性函数,

好吧,再一次,是的,不是的。

“广义线性模型”中的线性表示参数线性进入模型。具体来说,这意味着在线性预测变量的尺度上,模型的形式为η=g(μ)η=Xβ

进而可以通过使用适当的链接函数使用线性模型框架对其进行建模。

正确的

我想知道您是否考虑(教?)逻辑回归等情况:

(我在这里改变你的问题的顺序)

线性模型,因为链接将我们转换为线性模型框架

正是出于这个原因,将 GLM 称为“线性”是传统的做法。事实上,很明显这是约定,因为它就在名称中

非线性模型,给定参数的形式

这里我们必须非常小心,因为“非线性”一般是指参数非线性的模型。对比非线性回归与广义线性模型。

因此,如果您想使用术语“非线性”来描述 GLM,请务必仔细指定您的意思 - 通常,均值与预测变量非线性相关。

确实,如果您确实使用“非线性”来指代 GLM,那么您不仅会遇到困难(因此可能会被误解),而且在尝试谈论广义非线性模型时也会遇到困难。如果您已经将 GLM 描述为“非线性模型”,那么很难解释这种区别!

* 考虑一个泊松非线性回归模型,其中没有,所以我们仍然有:g(μ)

YPoisson(μx)

但是例如,其中是年龄,给定是观察到的死亡人数,而的人口年死亡率模型xYxμxx

μx=α+exp(βx).

(通常我们会在这里为年龄的人口提供一个偏移量,这会改变项,但我们可以假设我们观察到恒定暴露的情况。请注意,泊松模型和二项式模型都用于对死亡率进行建模。)xα

这里第一项表示由于(例如)事故(或与年龄无关的其他影响)导致的恒定死亡率,而第二项表示由于年龄而增加的死亡率。这样的模型有时可能在较短的成年但未衰老的年龄范围内是可行的;它本质上是Makeham 定律(这里以风险函数的形式呈现,但年化率将是一个合理的近似值)。

这是一个广义的非线性模型。