用 log 解释 Logit 模型中的边际效应××自变量

机器算法验证 状态 解释 罗吉特 对数 边际效应
2022-03-25 16:07:56

我完全被统计数据弄糊涂了,如果你能帮助我,我会很高兴。

如果我的自变量是对数转换的,我很难解释 logit 模型中的边际效应。

我将从下面的数据中说明我对示例的问题。我在stata中运行逻辑回归

我的因变量是虚拟的,表示游戏是否属于 X 类型。我的自变量是一个连续的对数转换变量(对数异质性)

在我运行 logit 回归后:

logit xGenre logheterogeneity + control variables

我得到以下结果:

我的独立变量的系数是 0.567

统计数据:

-X Genre        Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]

-log heterog|  .5655944  .1741354     3.25   0.001     .2242953    .9068935

为了能够更容易地解释结果,我应该看看边际效应。

因此,我使用了 mfx 命令。

我的结果显示如下:对于我的自变量,我得到 dy/dx = .056

统计数据:

-variable       dy/dx    Std. Err.     z    P>|z|  [    95% C.I.   ]      X

-log heter.  .0563382      .01688    3.34   0.001   .023259  .089417   3.51361

(*) dy/dx is for discrete change of dummy variable from 0 to 1

现在我对如何解释我的结果感到困惑。我可以说,如果我的自变量增加 10%(log helog.),那么我的游戏属于 Genre X 的概率增加了 0.56%。

1个回答

你知道在 logit 中:

Pr[y=1|x,z]=p=exp(α+βlnx+γz)1+exp(α+βlnx+γz).

经过一些繁琐的计算和简化,关于x变成:

Pr[y=1|x,z]x=βxp(1p).

这(有点)相当于

ΔpΔx=βxp(1p),

可以重写为

Δp100Δxx=βp(1p)100.

这是半弹性的定义,可以解释为 1% 变化的概率变化x.

这是 Stata 中的一个示例。* 请注意,我使用margins而不是 out-of-datemfx来获得平均边际效应x,1NΣi=1Nβpi(1pi)100

. sysuse auto, clear
(1978 Automobile Data)

. gen ln_price = ln(price)

. logit foreign ln_price mpg weight, nolog

Logistic regression                             Number of obs     =         74
                                                LR chi2(3)        =      57.69
                                                Prob > chi2       =     0.0000
Log likelihood = -16.185932                     Pseudo R2         =     0.6406

------------------------------------------------------------------------------
     foreign |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
    ln_price |   6.851215    2.11763     3.24   0.001     2.700737    11.00169
         mpg |  -.0880842   .1031317    -0.85   0.393    -.2902186    .1140503
      weight |  -.0062268   .0017269    -3.61   0.000    -.0096115   -.0028422
       _cons |  -41.32383   16.24003    -2.54   0.011    -73.15371   -9.493947
------------------------------------------------------------------------------

. margins, expression(_b[ln_price]*predict()*(1-predict())/100)

Predictive margins                              Number of obs     =         74
Model VCE    : OIM

Expression   : _b[ln_price]*predict()*(1-predict())/100

------------------------------------------------------------------------------
             |            Delta-method
             |     Margin   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
       _cons |   .0046371   .0007965     5.82   0.000      .003076    .0061982
------------------------------------------------------------------------------

这意味着价格每上涨 1%,汽车是外国的概率在 [0,1] 范围内增加 0.005。或者价格上涨 10% 会增加 0.05。在这个日期,大约 0.3 辆汽车是外国的,所以这些在经济和统计上都很重要。


编辑:

在 Stata 10 中执行此操作的一个好方法是安装用户编写的命令margeff

. margeff, dydx(ln_price) replace

Average partial effects after margeff
      y  = Pr(foreign) 

------------------------------------------------------------------------------
    variable |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
    ln_price |   .4637103   .0796514     5.82   0.000     .3075964    .6198241
         mpg |  -.0059616    .006781    -0.88   0.379    -.0192522     .007329
      weight |  -.0004214   .0000417   -10.11   0.000    -.0005031   -.0003398
------------------------------------------------------------------------------

. lincom _b[ln_price]/100

 ( 1)  .01*ln_price = 0

------------------------------------------------------------------------------
    variable |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         (1) |   .0046371   .0007965     5.82   0.000      .003076    .0061982
------------------------------------------------------------------------------

*这实际上不是一个很好的经验示例,因为数据中的关系具有倒 U 形。