使用 Python 计算单变量和多变量 Logistic 回归

数据挖掘 Python 逻辑回归
2022-02-24 08:57:56

我有一个包含许多变量和一个二进制因变量的简单数据集。数据存储在数据框中。当我在数据帧上使用 python 的 statsmodels.api 和 logit.fit() 时,我会看到一个表格,详细说明每个变量的 p 值和置信区间等。我需要计算每个变量的单变量和多变量 p 值和置信区间,但是我不确定 logit.fit 正在计算什么 - 多变量?如果是这样,我如何计算单变量值 - 也许一次只分析一个变量?下面的示例输出:

==============================================================================
Dep. Variable:           Vehicle        No. Observations:                11540
Model:                          Logit   Df Residuals:                    11515
Method:                           MLE   Df Model:                           24
Date:                Thu, 29 Aug 2019   Pseudo R-squ.:                 0.05443
Time:                        11:57:39   Log-Likelihood:                -7463.8
converged:                       True   LL-Null:                       -7893.4
                                        LLR p-value:                6.082e-166
=========================================================================================
                            coef    std err          z      P>|z|      [0.025      0.975]
-----------------------------------------------------------------------------------------
Red                    0.0084      0.001      6.880      0.000       0.006       0.011
Green                  0.1345      0.041      3.293      0.001       0.054       0.215
2个回答

当您尝试y使用多个解释变量来解释时,回归是多元的。每个系数都必须解释为给定 的影响x,同时保持所有其他值不变。

当它只需要一个变量时,它是单变量的。

因此,您必须一个一个地独立于多变量运行单变量模型。

我想有人正在寻找同样的东西。答案相当明显。呈现的结果是多变量分析。为了实现单变量分析,一次处理一个变量。