估计面板数据回归中的稳健标准误差

机器算法验证 r 面板数据 标准错误 稳健标准错误 plm
2022-04-10 06:58:44

我试图估计面板数据回归中的稳健标准误差。我从概念上理解面板数据回归,但 R 提供了很多我不确定的选项。我的数据格式如下:

  id time name           y          x1          x2
   1   10    A  1.28233854 -0.42411039  1.89640596
   1   11    A -0.59541995 -0.43214374  0.07386285
   1   12    A  0.88951720 -1.55417836  0.28276157
   2   10    B  1.11211744 -0.89200195  0.88989664
   2   11    B -0.37737953  0.09055494  1.20764357
   3   10    C  0.03258314 -0.13834344 -0.97812765
   3   11    C -0.97645525 -0.14313482 -1.03528695
   3   12    C -0.02031554  0.02061293 -0.71353867    

这是创建数据的 R 代码:

x <- data.frame(id = rep(c(1, 2, 3), c(3,2,3)), time = c(10,11,12,10,11,10,11,12),name= rep(c("A", "B", "C"), c(3,2,3)), y = rnorm(8), x1 = rnorm(8), x2 = rnorm(8))

为了执行回归和稳健的标准误差,我使用:

library(plm)
library(sandwich)
library(lmtest)

attach(x)
# Pooling:
r1 <- plm(y ~ x1 + x2, model="pooling", x, index = c("id","time"))
r1
coeftest(r1,vcov=vcovHC(r1,type="HC0",cluster="group"))

# Fixed effects:
r2 <- plm(y ~ x1 + x2, model="within", x, index = c("id","time"))
r2
coeftest(r2,vcov=vcovHC(r2,type="HC0",cluster="group"))

detach(x)

我的问题如下:

1)在池模型和固定效应模型中按组聚类是否正确?我也可以按时间分组。我的问题是,在固定效应模型中,我们只考虑随时间变化的内部变化,所以据我了解,在这种方法下按组对标准误差进行聚类是没有任何意义的。

2) 有 3 个选项可以选择效果,“个人”、“时间”或“双向”。但我找不到任何好的解释,在哪种模型下使用哪种效果。也许有人可以告诉我在上述简单模型中使用哪种效果,无论是在内部模型中还是在池模型中。

1个回答

1)鉴于您已"id"在回归中指定(我猜个人或您随着时间的推移遵循的其他单位),cluster="group"标准误差在个人水平上聚集。这是有道理的,因为一个人今天的错误可能与她昨天的错误相关。有关详细信息,请参阅这些说明的第 14 页。

2)默认是在模型中具有单独的效果,这相当于有一个虚拟的N1个人。如果您指定twoways选项,则模型还将包括T1时间假人以估计个体和时间固定效应(参见第 12 页,Croissant 和 Millo (2008)“R 中的面板数据计量经济学:plm 包”,链接)。