机器算法验证 - 广义线性模型中链接函数的用途 - 吾爱随笔录

广义线性模型中链接函数的用途

机器算法验证回归广义线性模型链接功能爱尔兰人

2022-02-11 15:21:02

链接函数作为广义线性模型的组成部分的目的是什么？为什么我们需要它？

维基百科指出：

可以方便地将链接函数的域匹配到分布函数的均值范围

这样做有什么好处？

2个回答

AJ Dobson 在她的书中指出了以下几点：

线性回归假设响应变量是正态分布的。广义线性模型可以具有非正态分布的响应变量——它们甚至可能是分类的而不是连续的。因此，它们可能不在范围内 $-\infty$ 到 $+\infty$ .
响应变量和解释变量之间的关系不必是简单的线性形式。

这就是为什么我们需要链接函数作为广义线性模型的一个组成部分。它链接因变量的平均值 $Y_i$ ，即 $E(Y_i)=\mu_i$ 到线性项 $x_i^T\beta$ 使得非线性变换均值的范围 $g(\mu_i)$ 范围从 $-\infty$ 到 $+\infty$ . 因此，您实际上可以形成一个线性方程 $g(\mu_i)$ = $x_i^T\beta$ 并使用迭代重新加权最小二乘法对模型参数进行最大似然估计。

在这里阅读我的答案可能会对您有所帮助：Difference between logit and probit models，其中广泛讨论了 GLiM 链接。

@BlainWaan 和维基百科清楚地阐述了解释这个问题的基本方法：实际参数（例如， $p$ 对于二项式响应（即逻辑回归）不能从负无穷大到正无穷大，但您的预测参数会。第二个重要原因是，如果没有正确指定的链接，残差的方差将不是恒定的（使用普通最小二乘估计进行推理的必要假设）或处理不当。

解决这个问题的另一种方法是，通过使用身份链接（这是另一种说法/思考“不使用”链接功能的方式）意味着您以一种必然扭曲图片的方式错误地考虑您的情况您从分析中得出的情况。例如，除非您尝试建模的真实概率（再次针对逻辑回归情况）仅存在于范围的中间（它们是相当线性的），并且 $X$ 您正在检查的中心是 $p=.5$ ，您的 beta 将有偏差，而您的预测 $\hat p_{x_i}$ 的值将远离真实值。此外，您的推论也会被扭曲（例如，I 类错误率不等于 $\alpha$ ）。

其它你可能感兴趣的问题

上一篇开源统计教科书？下一篇为什么朴素贝叶斯分类器表现如此出色？