statsmodel api我使用Python 中的可用模型运行了一个 logit 模型。我对如何理解这些问题没有几个问题
summary1)和summary2输出有什么区别?
2)为什么AICand BICscore在2k-3k的范围内?我在网上读到,较低的值AIC和BIC表示好的模型。我的模型做得好吗?AIC和是否有最佳范围BIC?
3 )如您所见covariance Type。non-robust它是什么,我应该关注它吗?
4)还有什么field/item in the output需要注意的吗?
5) 您可以在下面看到某些重要变量(如X2、X8、 )X45的系数非常低。它们怎么可能很重要并且仍然具有非常低或接近于零的系数?正常吗?
这是我得到的输出
汇总输出
Dep. Variable: vae_flag No. Observations: 3298
Model: Logit Df Residuals: 3241
Method: MLE Df Model: 56
Date: Mon, 30 Dec 2019 Pseudo R-squ.: 0.3347
Time: 21:18:36 Log-Likelihood: -1392.2
converged: True LL-Null: -2092.7
Covariance Type: nonrobust LLR p-value: 3.894e-256
摘要2输出
Model: Logit Pseudo R-squared: 0.335
Dependent Variable: op_flag AIC: 2898.4259
Date: 2019-12-30 21:18 BIC: 3246.1870
No. Observations: 3298 Log-Likelihood: -1392.2
Df Model: 56 LL-Null: -2092.7
Df Residuals: 3241 LLR p-value: 3.8937e-256
Converged: 1.0000 Scale: 1.0000
No. Iterations: 7.0000
重要变量
coef std err z P>|z| [0.025 0.975]
x2 0.0321 0.060 11.227 0.000 0.558 0.794
x6 2.2996 0.095 24.332 0.000 2.114 2.485
x7 -1.8795 0.082 -22.835 0.000 -2.041 -1.718
x8 0.0002 0.058 2.116 0.034 0.009 0.237
x16 0.2693 0.059 4.564 0.000 0.154 0.385
x33 -0.3138 0.139 -2.254 0.024 -0.587 -0.041
x34 0.4644 0.137 3.392 0.001 0.196 0.733
x45 0.0088 0.052 2.306 0.021 0.018 0.221
x52 -0.1755 0.087 -2.007 0.045 -0.347 -0.004
x55 -0.0982 0.050 -1.965 0.049 -0.196 -0.000