我试图估计面板数据回归中的稳健标准误差。我从概念上理解面板数据回归,但 R 提供了很多我不确定的选项。我的数据格式如下:
id time name y x1 x2
1 10 A 1.28233854 -0.42411039 1.89640596
1 11 A -0.59541995 -0.43214374 0.07386285
1 12 A 0.88951720 -1.55417836 0.28276157
2 10 B 1.11211744 -0.89200195 0.88989664
2 11 B -0.37737953 0.09055494 1.20764357
3 10 C 0.03258314 -0.13834344 -0.97812765
3 11 C -0.97645525 -0.14313482 -1.03528695
3 12 C -0.02031554 0.02061293 -0.71353867
这是创建数据的 R 代码:
x <- data.frame(id = rep(c(1, 2, 3), c(3,2,3)), time = c(10,11,12,10,11,10,11,12),name= rep(c("A", "B", "C"), c(3,2,3)), y = rnorm(8), x1 = rnorm(8), x2 = rnorm(8))
为了执行回归和稳健的标准误差,我使用:
library(plm)
library(sandwich)
library(lmtest)
attach(x)
# Pooling:
r1 <- plm(y ~ x1 + x2, model="pooling", x, index = c("id","time"))
r1
coeftest(r1,vcov=vcovHC(r1,type="HC0",cluster="group"))
# Fixed effects:
r2 <- plm(y ~ x1 + x2, model="within", x, index = c("id","time"))
r2
coeftest(r2,vcov=vcovHC(r2,type="HC0",cluster="group"))
detach(x)
我的问题如下:
1)在池模型和固定效应模型中按组聚类是否正确?我也可以按时间分组。我的问题是,在固定效应模型中,我们只考虑随时间变化的内部变化,所以据我了解,在这种方法下按组对标准误差进行聚类是没有任何意义的。
2) 有 3 个选项可以选择效果,“个人”、“时间”或“双向”。但我找不到任何好的解释,在哪种模型下使用哪种效果。也许有人可以告诉我在上述简单模型中使用哪种效果,无论是在内部模型中还是在池模型中。