我有一个关于语义的问题,希望得到其他统计学家的意见。
我们知道诸如逻辑、泊松等模型属于广义线性模型的范畴。该模型包括参数的非线性函数,进而可以通过使用适当的链接函数使用线性模型框架对其进行建模。
我想知道您是否考虑(教?)逻辑回归等情况:
- 非线性模型,给定参数的形式
- 线性模型,因为链接将我们转换为线性模型框架
- 同时(1)和(2):它“开始”是一个非线性模型,但可以以允许我们将其视为线性模型的方式进行处理
希望我可以设置一个实际的民意调查...
我有一个关于语义的问题,希望得到其他统计学家的意见。
我们知道诸如逻辑、泊松等模型属于广义线性模型的范畴。该模型包括参数的非线性函数,进而可以通过使用适当的链接函数使用线性模型框架对其进行建模。
我想知道您是否考虑(教?)逻辑回归等情况:
希望我可以设置一个实际的民意调查...
这是一个很好的问题。
我们知道诸如逻辑、泊松等模型属于广义线性模型的范畴。
嗯,是的,也不是。鉴于问题的上下文,我们必须非常小心地说明我们在谈论什么——单独的“逻辑”和“泊松”不足以描述预期的内容。
(i) “泊松”是一个分布。作为条件分布的描述,它不是线性的(因此不是 GLM),除非您指定一个线性(参数)模型来描述条件均值(即仅说“泊松”是不够的)。当人们指定“泊松回归”时,他们几乎总是打算使用参数线性的模型,因此是 GLM 。但是仅“泊松”就可以是任意数量的事物*。
(ii) 另一方面,“逻辑”是指对均值的描述(均值在预测变量中是逻辑的)。它不是 GLM,除非你将它与指数族的条件分布结合起来。另一方面,当人们说“逻辑回归”时,他们几乎总是指具有 logit 链接的二项式模型——这确实意味着预测变量是逻辑的,模型在参数上是线性的并且在指数族中,GLM 也是如此。
该模型包括参数的非线性函数,
好吧,再一次,是的,不是的。
“广义线性模型”中的线性表示参数线性进入模型。具体来说,这意味着在线性预测变量的尺度上,模型的形式为。
进而可以通过使用适当的链接函数使用线性模型框架对其进行建模。
正确的
我想知道您是否考虑(教?)逻辑回归等情况:
(我在这里改变你的问题的顺序)
线性模型,因为链接将我们转换为线性模型框架
正是出于这个原因,将 GLM 称为“线性”是传统的做法。事实上,很明显这是约定,因为它就在名称中。
非线性模型,给定参数的形式
这里我们必须非常小心,因为“非线性”一般是指参数非线性的模型。对比非线性回归与广义线性模型。
因此,如果您想使用术语“非线性”来描述 GLM,请务必仔细指定您的意思 - 通常,均值与预测变量非线性相关。
确实,如果您确实使用“非线性”来指代 GLM,那么您不仅会遇到困难(因此可能会被误解),而且在尝试谈论广义非线性模型时也会遇到困难。如果您已经将 GLM 描述为“非线性模型”,那么很难解释这种区别!
* 考虑一个泊松非线性回归模型,其中没有,所以我们仍然有:
但是例如,其中是年龄,给定是观察到的死亡人数,而的人口年死亡率模型:
(通常我们会在这里为年龄的人口提供一个偏移量,这会改变项,但我们可以假设我们观察到恒定暴露的情况。请注意,泊松模型和二项式模型都用于对死亡率进行建模。)
这里第一项表示由于(例如)事故(或与年龄无关的其他影响)导致的恒定死亡率,而第二项表示由于年龄而增加的死亡率。这样的模型有时可能在较短的成年但未衰老的年龄范围内是可行的;它本质上是Makeham 定律(这里以风险函数的形式呈现,但年化率将是一个合理的近似值)。
这是一个广义的非线性模型。