R 中 ivreg() 诊断的解释

机器算法验证 r 计量经济学 工具变量 豪斯曼
2022-02-28 05:01:11

我正试图ivreg()从 {AER} 包中解释 R 中命令的诊断。运行帮助页面中提供的示例代码:

## data
data("CigarettesSW", package = "AER")
CigarettesSW$rprice <- with(CigarettesSW, price/cpi)
CigarettesSW$rincome <- with(CigarettesSW, income/population/cpi)
CigarettesSW$tdiff <- with(CigarettesSW, (taxs - tax)/cpi)

## model 
fm <- ivreg(log(packs) ~ log(rprice) + log(rincome) | log(rincome) + tdiff + I(tax/cpi), data = CigarettesSW, subset = year == "1995")
summary(fm, vcov = sandwich, df = Inf, diagnostics = TRUE)

您会得到以下输出:

Call:
ivreg(formula = log(packs) ~ log(rprice) + log(rincome) | log(rincome) + 
tdiff + I(tax/cpi), data = CigarettesSW, subset = year == 
"1995")

Residuals:
   Min         1Q     Median         3Q        Max 
-0.6006931 -0.0862222 -0.0009999  0.1164699  0.3734227 

Coefficients:
         Estimate Std. Error z value Pr(>|z|)    
(Intercept)    9.8950     0.9288  10.654  < 2e-16 ***
log(rprice)   -1.2774     0.2417  -5.286 1.25e-07 ***
log(rincome)   0.2804     0.2458   1.141    0.254    

Diagnostic tests:
             df1 df2 statistic p-value    
Weak instruments   2  44   228.738  <2e-16 ***
Wu-Hausman         1  44     3.823  0.0569 .  
Sargan             1  NA     0.333  0.5641    

我对诊断测试的解释很感兴趣。这是否意味着这些工具很弱或没有?考虑到它在 10% 的水平上显着,Wu-Hausman 是什么意思?Sargan 不重要意味着什么?

1个回答

演示文稿通过工作示例提供了一个不错的概述。

弱工具是指该工具与内生解释变量的相关性较低。这可能导致系数的较大方差和严重的有限样本偏差。“治疗可能比疾病更糟”(Bound, Jaeger, Baker, 1993/1995)。有关更多详细信息,请参见此处从 AER 的帮助文件中,它说它对第一阶段回归进行了 F 检验;我相信空值是仪器很弱。对于您报告的模型,空值被拒绝,因此您可以继续假设该工具足够强大。

Wu-Hausman测试 IV 与 OLS 一样一致,并且由于 OLS 更有效,因此更可取。这里的空值是它们同样一致;在这个输出中,Wu-Hausman 在 p<0.1 的水平上是显着的,所以如果你对这个置信水平没问题,那就意味着 IV 是一致的,而 OLS 不是。

Sargan测试过度识别限制。这个想法是,如果每个内生变量有一个以上的工具,则模型被过度识别,并且您有一些多余的信息。所有工具都必须是有效的,才能使推论正确。因此它测试所有外生工具实际上都是外生的,并且与模型残差不相关。如果它很重要,则意味着您没有有效的工具(那里的某个地方,因为这是一项全球测试)。在这种情况下,这不是问题。这可能会变得更加复杂,研究人员建议进行进一步的分析(见此