机器算法验证 - 理解广义线性模型中的链接函数 - 吾爱随笔录

理解广义线性模型中的链接函数

机器算法验证物流广义线性模型线性的链接功能

2022-04-11 22:01:53

我仍在尝试学习（可能是术语问题）“链接功能”是什么意思。例如，在逻辑回归中，我们假设响应变量来自二项分布。

链接函数将实数从（从输出）转换为概率数。但它如何“链接”到作为离散分布的二项分布？ $\text{logit}^{-1}$ $(-\infty, -\infty)$ $\beta^{\top}x$ $[0,1]$

我知道“链接”是在实数和概率数之间，但是从概率数到二项分布有一些缺失的部分。

我对吗？

2个回答

因此，当您有二进制响应数据时，每个观察结果都会有“是/否”或“1/0”的结果。但是，在进行二元响应回归时，您试图估计的不是您施加的每组自变量值的 1/0 结果，而是具有此类特征的个体将导致“是”结果的概率. 然后响应不再是离散的，而是连续的（在 (0,1) 区间内）。数据中的响应（真正）确实是二元的，但估计的响应（或）是概率。 $y_i$ $\Lambda(x_i'b)$ $\Phi(x_i'b)$

这些链接函数的基本含义是它们是我们对潜在变量模型中的误差项施加的分布。想象一下，每个人都有一种潜在的（不可观察的）意愿在结果中说“是”（或成为 1）。然后我们将这种意愿建模为，使用对个人特征的线性回归（这是多元回归中的向量）： $y_i^*$ $x_i$

y_{i}^{*} = x_{i}^{'} β + ϵ_{i} .

$y_i^*=x_i'\beta + \epsilon_i.$

这就是所谓的潜变量回归。如果此人的意愿是积极的（），则个人观察到的结果将是“是”（），否则为“否”。请注意，阈值的选择并不重要，因为潜在变量模型具有截距。 $y_i^*>0$ $y_i=1$

在线性回归中，我们假设误差项是正态分布的。在二元响应和其他模型中，我们需要对误差项施加/假设分布。链接函数是误差项遵循的累积概率函数。例如，如果它是逻辑的（我们将在第四个等式中使用逻辑分布是对称的），

P (y_{i} = 1) = P (y_{i}^{*} > 0) = P (x_{i}^{'} β + ϵ_{i} > 0) = P (ϵ_{i} > - x_{i}^{'} β) = P (ϵ_{i} < x_{i}^{'} β) = Λ (x_{i}^{'} β) .

$P(y_i=1)=P(y_i^*>0)=P(x_i'\beta + \epsilon_i>0)=P(\epsilon_i>-x_i'\beta)=P(\epsilon_i<x_i'\beta)=\Lambda(x_i'\beta).$

如果您假设错误是正态分布的，那么您将有一个概率链接，而不是。 $\Phi(\cdot)$ $\Lambda(\cdot)$

广义线性模型是根据线性预测器定义的

η = X β

$\eta = X\beta$

接下来是描述条件分布的概率分布 $Y$ 和一个链接功能 $g$ “提供了线性预测变量和分布函数的平均值之间的关系”，因为我们没有预测 $Y$ 而是条件均值 $Y$ 给定的预测器 $X$ ， IE

E (Y | X) = g^{- 1} (η)

$E(Y|X) = g^{-1}(\eta)$

在高斯族 GLM（线性回归）的情况下，恒等函数被用作链接函数，所以 $E(Y|X) = \eta$ ，而在逻辑回归的情况下使用 logit 函数。（倒数）logit 函数转换 $\eta$ 在 $(-\infty, \infty)$ 至 $(0, 1)$ ，因为逻辑回归预测成功的概率，即伯努利分布的平均值。其他函数用于将线性预测变量转换为不同分布的均值，例如泊松回归的对数函数，或伽马回归的反向链接。所以链接函数不链接的值 $Y$ （例如二元，在逻辑回归的情况下）和线性预测，但分布的平均值 $Y$ 和 $\eta$ （实际上，将概率转换为 $0$ '沙 $1$ 的你还需要一个判定规则）。所以外卖的信息是我们没有预测 $Y$ 而是用概率模型和估计条件分布的参数来描述它 $Y$ 给定 $X$ .

要了解有关链接函数和 GLM 的更多信息，您可以查看 GLM 的“链接函数”和“规范链接函数”之间的差异、广义线性模型中链接函数的目的以及logit 和 probit 模型线程之间的差异，非常好的维基百科文章GLM和McCullagh 和 Nelder的广义线性模型书。

其它你可能感兴趣的问题

上一篇为什么多元回归的自由度为 n - k - 1？对于线性回归，为什么是 n - 2？下一篇SelectKBest - 特征选择 - Python - SciKit 学习