如果我们在线性回归中将变量更改某个百分比,如何确定目标变量将更改多少百分比?

机器算法验证 回归 机器学习 假设检验 线性的
2022-04-07 05:30:01

我在一些数据上训练了一个线性回归模型。现在我有了截距和其他系数。给定一个特征的某些百分比变化,如何将其与目标的百分比变化联系起来,同时保持所有其他不变?

2个回答

假设我们已经安装了一个模型,例如:

y=x1+x2+ϵ

我们得到了估计,给出了以下等式:

y^=2x1+3x2

因此对于 1 个单位的变化x1我们预计 2 个单位的变化y.

无法获得预期的百分比变化y从百分比变化x除非变量在运行模型之前处于对数刻度上。

我们可以用一些关于协变量的辅助信息来支持答案。

您的线性模型可能类似于

[是的|X,z]=是的^=α^+β^X+δ^z.

期望值的变化是多少是的与 1 个单位更改相关联X? 我们可以很容易地从导数中得到:

Δ是的^ΔX=β^.

然后我们可以将其转化为弹性:

ε=100Δ是的^是的^100ΔXX=%Δ是的^%ΔX=β^X是的^=是的^XX是的^.

换句话说,要获得弹性,我们只需要将回归系数乘以X的价值X本身超过了预测是的. 请注意,这是协变量的函数,并且可能因观察结果而异。我们需要一些方法来总结个体的弹性。

有几种方法可以将其付诸实践,但最常见的是取样本中的平均值:

ε¯=1ñ一世=1ñβ^X一世是的^一世.

一些软件可以为我们做到这一点,这使得标准误差的计算变得更加容易。这是Stata中的一个示例:

. sysuse auto, clear
(1978 automobile data)

. regress price mpg foreign

      Source |       SS           df       MS      Number of obs   =        74
-------------+----------------------------------   F(2, 71)        =     14.07
       Model |   180261702         2  90130850.8   Prob > F        =    0.0000
    Residual |   454803695        71  6405685.84   R-squared       =    0.2838
-------------+----------------------------------   Adj R-squared   =    0.2637
       Total |   635065396        73  8699525.97   Root MSE        =    2530.9

------------------------------------------------------------------------------
       price | Coefficient  Std. err.      t    P>|t|     [95% conf. interval]
-------------+----------------------------------------------------------------
         mpg |  -294.1955   55.69172    -5.28   0.000    -405.2417   -183.1494
     foreign |   1767.292    700.158     2.52   0.014     371.2169    3163.368
       _cons |   11905.42   1158.634    10.28   0.000     9595.164    14215.67
------------------------------------------------------------------------------

. /* canned */
. margins, eyex(mpg)

Average marginal effects                                    Number of obs = 74
Model VCE: OLS

Expression: Linear prediction, predict()
ey/ex wrt:  mpg

------------------------------------------------------------------------------
             |            Delta-method
             |      ey/ex   std. err.      t    P>|t|     [95% conf. interval]
-------------+----------------------------------------------------------------
         mpg |  -1.238224   .3721885    -3.33   0.001    -1.980347   -.4961013
------------------------------------------------------------------------------

. /* by hand */
. predict yhat, xb

. generate elasticity =  -294.1955 *(mpg/yhat)

. summarize elasticity

    Variable |        Obs        Mean    Std. dev.       Min        Max
-------------+---------------------------------------------------------
  elasticity |         74   -1.238224    1.060581  -7.488722  -.4215304

这意味着 mpg 增加 1% 与价格下降 1.2% 相关。

如果我们没有原始数据,但有一些关于协变量和系数的汇总统计数据,我们可以将它们代入第一个公式而不是求平均值。答案不会完全匹配,但通常相当接近。