机器算法验证 - 你在逻辑回归中做线性回归吗？ - 吾爱随笔录

你在逻辑回归中做线性回归吗？

机器算法验证物流多重回归 S形曲线

2022-04-10 01:14:06

两天前我刚刚研究了单线性回归和多元线性回归，现在我正在阅读有关逻辑回归的内容，我想从头开始实现它，我只想知道我对逻辑回归的理解是否正确。

你看我实际上对逻辑回归很困惑，在我对逻辑回归的理解中，我们仍然使用线性回归方程

\hat{y} = {\hat{β}}_{0} + {\hat{β}}_{1} x_{1} + \dots + {\hat{β}}_{n} x_{n}

$\hat{y} = \hat\beta_0+\hat\beta_1x_1+\cdots+\hat\beta_nx_n$

所以我认为这里发生的是：

首先找到最佳拟合线，为此我们需要找到 beta 系数，就像多元线性回归一样
找到后 $\hat\beta$ 系数，我们将它们与我们的自变量一起插入 sigmoid 函数以获得预测， $P (x) = \frac{1}{1 + e^{- (b_{0} + b_{1} x_{1} + . . . + b_{n} x_{n})}}$ $P(x) = \frac{1}{1+e^{-(b_0+b_1x_1+...+b_nx_n)}}$ 然后就是这样。

是这样完成的吗？还是那错了？还是我们需要先或之后做一些步骤？

2个回答

将逻辑回归比作标准线性回归的最简单方法是使用潜在变量解释。逻辑回归模型可以通过考虑可观察到的响应来描述：

Y_{i} = I (Y_{i}^{*} > 0),

$Y_i = \mathbb{I}(Y_i^* > 0),$

基于不可观察的潜在变量：

Y_{i}^{*} = β_{0} + β_{1} x_{i, 1} + \dots + β_{m} x_{i, m} + ε_{i} ε_{1}, . . . ε_{n} \sim IID Logistic (0, s) .

$Y_i^* = \beta_0 + \beta_1 x_{i,1} + \cdots + \beta_m x_{i,m} + \varepsilon_i \quad \quad \quad \varepsilon_1, ... \varepsilon_n \sim \text{IID Logistic}(0, s).$

如您所见，在此模型中，潜在响应变量遵循线性回归模型，其误差项具有逻辑分布。我们观察潜在响应变量是否高于零，但我们没有观察它的实际值。出于估计的目的，这体现在估计模型中的系数时存在很大差异。我们不使用 OLS 估计进行估计，因此这不是“就像多元线性回归”。尽管如此，我们确实得到了估计的系数，这确实得到了响应结果的条件概率的估计函数，所以肯定有相似之处。

不，不是这样的。引用我的另一个答案

逻辑回归可以描述为线性组合

$η = β_{0} + β_{1} X_{1} + . . . + β_{k} X_{k}$ $\eta = \beta_0 + \beta_1 X_1 + ... + \beta_k X_k$

通过链接函数传递 $g$ ：

$g (E (Y)) = η$ $g(E(Y)) = \eta$

其中链接函数是一个logit函数

$E (Y | X, β) = p = {logit}^{- 1} (η)$ $E(Y|X,\beta) = p = \text{logit}^{-1}( \eta )$

如您所见，线性预测器 $\eta = \mathbf{X}\boldsymbol{\beta}$ 不等于条件均值 $y$ ，但您需要先使用 logit链接函数的倒数对其进行转换 $g^{-1}(\eta)$ . 如果您只是运行线性回归，您将忽略线性预测变量发生转换的事实。

您可以自己轻松地验证这一点，对相同的数据运行线性回归和逻辑回归。如果使用线性回归就足够了，你应该得到相同的回归参数。正如您从下面的示例中看到的那样，情况并非如此。

> lm(vs~mpg+cyl, data=mtcars)

Call:
lm(formula = vs ~ mpg + cyl, data = mtcars)

Coefficients:
(Intercept)          mpg          cyl  
   2.164638    -0.008217    -0.252454 

> glm(vs~mpg+cyl, family=binomial, data=mtcars)

Call:  glm(formula = vs ~ mpg + cyl, family = binomial, data = mtcars)

Coefficients:
(Intercept)          mpg          cyl  
    15.9714      -0.1633      -2.1482  

Degrees of Freedom: 31 Total (i.e. Null);  29 Residual
Null Deviance:      43.86 
Residual Deviance: 17.49    AIC: 23.49

逻辑回归通过使用最大化似然函数的优化算法进行拟合。似然函数根据伯努利分布定义：

L (β | y; X) = \prod_{i} g^{- 1} (X_{i} β)^{y_{i}} (1 - g^{- 1} (X_{i} β))^{1 - y_{i}}

$L(\boldsymbol{\beta}|y;\mathbf{X}) = \prod_i\, g^{-1}(\mathbf{X}_i\boldsymbol{\beta})^{y_i} \, (1 - g^{-1}(\mathbf{X}_i\boldsymbol{\beta}))^{1-y_i}$

通常使用IRLS 算法来寻找这个函数的最大值，但你可能会忽略这个事实，在没有这些知识的情况下过上幸福的生活。

其它你可能感兴趣的问题

上一篇当时间序列不是静止的时，是否可以取其平均值？下一篇为什么熵有时被写成一个以随机变量为参数的函数？