面板数据规格

机器算法验证 状态 计量经济学 面板数据 固定效应模型
2022-03-18 13:35:02

我正在尝试为我的数据集找出最佳规范。

我试图在解释变量的三个类似面板数据模型中探讨波兰经济特区在经济增长方面的有效性:a)登记失业率 b)人均 GDP c)人均固定资本形成总额. 该数据适用于 NUTS3 子区域。年次区域有经济特区和少数经济变量;年频率,66 个子区域的数据集为 2004-2012 年。t

我尝试过固定和随机效果。至于现在,我选择了FE,因为意义和理论上正确的符号。但是有一些问题使我无法将其视为理所当然:

  1. 如何测试自相关和互相关?

  2. 我不知道如何测试错误项在 Stata 中的分布,此外,如果它不是正态分布的,我应该关心它吗?

  3. 据我从文献中了解到,解释变量之间的相关系数值与接近-1或1的误差项实际上并不差;就我而言,您可以看到它几乎是-1。

  4. 混合模型是否适合我的数据集?

我附上了解释失业率的模型的结果。

代码:

xtreg  st_bezr sse01 wartosc_sr_trw_per_capita zatr_przem_bud podm_gosp_na_10tys_ludn proc_ludn_wiek_prod ludnosc_na_km2, fe

Fixed-effects (within) regression               Number of obs      =       594
Group variable: id                              Number of groups   =        66

R-sq:  within  = 0.4427                         Obs per group: min =         9
       between = 0.3479                                        avg =       9.0
       overall = 0.2365                                        max =         9

                                                F(6,522)           =     69.10
corr(u_i, Xb)  = -0.9961                        Prob > F           =    0.0000

-------------------------------------------------------------------------------------------
                  st_bezr |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
                    sse01 |  -1.406066   .4631984    -3.04   0.003    -2.316028   -.4961045
wartosc_sr_trw_per_capita |  -.0000963   .0000166    -5.79   0.000    -.0001289   -.0000636
           zatr_przem_bud |  -26.11989   4.992198    -5.23   0.000    -35.92716   -16.31263
  podm_gosp_na_10tys_ludn |  -.0201788   .0030788    -6.55   0.000    -.0262273   -.0141304
      proc_ludn_wiek_prod |  -229.1996   16.92631   -13.54   0.000    -262.4516   -195.9475
           ludnosc_na_km2 |   .0790167   .0120865     6.54   0.000     .0552726    .1027609
                    _cons |   161.9786   10.76989    15.04   0.000      140.821    183.1363
--------------------------+----------------------------------------------------------------
                  sigma_u |  53.986519
                  sigma_e |  2.5446248
                      rho |  .99778327   (fraction of variance due to u_i)
-------------------------------------------------------------------------------------------
F test that all u_i=0:     F(65, 522) =    27.09             Prob > F = 0.0000
1个回答

对于这个答案中的Stata命令,让我在本地收集你的变量:
local xlist sse01 wartosc_sr_trw_per_capita zatr_przem_bud podm_gosp_na_10tys_ludn proc_ludn_wiek_prod ludnosc_na_km2
所以现在你总是可以用`xlist'调用所有变量

1) 在固定效应回归后,您可以使用两个命令。

  • xttest2执行 Breusch-Pagan LM 检验,原假设为残差之间不存在相关性。这是对同时期相关性的检验。不拒绝空值意味着检验未检测到残差中的任何横截面依赖性。
  • xttest3执行组异方差的 Wald 检验的修改版本。原假设是同方差性。

ssc instal xttest2您可以通过键入和来安装这两个命令ssc instal xttest3如果您检测到残差之间的相关性,您可以使用稳健选项对此进行校正:
xtreg st_bezr 'xlist', fe robust

要测试自相关,您可以通过以下方式应用拉格朗日乘数检验xtserial
xtserial st_bezr 'xlist'
原假设不是序列相关。要纠正序列相关性和异方差性,您可以将 cluster 选项与您的 id 变量一起使用:
xtreg st_bezr 'xlist', fe cluster(id)

2)对于残差的正态性检验:您可以predict res, e在固定效应回归后通过 predict 命令获得残差。对于目视检查,您可以使用:

  • kdensity res, normal(绘制残差分布并将其与正态进行比较)
  • pnorm res(绘制标准化正态概率图)
  • qnorm res(绘制残差的分位数与正态分布的分位数)

使用 pnorm 您可以查看分布中间是否存在非正态性,而 qnorm 会向您显示尾部的任何非正态性。可以通过 获得正式测试swilk res零假设是残差是正态分布的。一般来说,非正态性不是一个太大的问题,但它对推理很重要。您可以再次使用强大的选项对此进行更正。

3)拥有corr(u_i, Xb) = -0.9961意味着固定效应与您的解释变量密切相关,因此您通过控制这些固定效应做得很好。这种类型的强相关性通常表明合并 OLS 或随机效应不适合您的目的,因为这两个模型都假设之间的相关性为零。uiXβ

4)通常是的,但这取决于您要估计什么或如何处理您的数据,即您的变量是否是随机变量。是@mpiktas 对混合效果和面板数据模型之间差异的一个很好的解释,它肯定会对您有所帮助。