我有一个包含许多变量和一个二进制因变量的简单数据集。数据存储在数据框中。当我在数据帧上使用 python 的 statsmodels.api 和 logit.fit() 时,我会看到一个表格,详细说明每个变量的 p 值和置信区间等。我需要计算每个变量的单变量和多变量 p 值和置信区间,但是我不确定 logit.fit 正在计算什么 - 多变量?如果是这样,我如何计算单变量值 - 也许一次只分析一个变量?下面的示例输出:
==============================================================================
Dep. Variable: Vehicle No. Observations: 11540
Model: Logit Df Residuals: 11515
Method: MLE Df Model: 24
Date: Thu, 29 Aug 2019 Pseudo R-squ.: 0.05443
Time: 11:57:39 Log-Likelihood: -7463.8
converged: True LL-Null: -7893.4
LLR p-value: 6.082e-166
=========================================================================================
coef std err z P>|z| [0.025 0.975]
-----------------------------------------------------------------------------------------
Red 0.0084 0.001 6.880 0.000 0.006 0.011
Green 0.1345 0.041 3.293 0.001 0.054 0.215