从调解的角度看工具变量和排除限制

机器算法验证 工具变量 治疗效果 熔岩
2022-04-11 19:56:59

我无法理解工具变量中的排除限制。

我理解公正的治疗效果是B=Cov(Y,Z)Cov(S,Z), 在哪里Y是结果,S是治疗,并且Z是仪器。换句话说,B=ITTCompliance Rate.

但是,如果我在调解框架中考虑这一点,并应用排除限制,这将越来越没有意义。

在中介框架中,ITT = 总效果,或Cov(S,Z)Cov(Y,S)+Cov(Y,Z|S). 所以,无偏的处理效果是:

(Cov(S,Z)Cov(Y,S)+Cov(Y,Z|S))Cov(S,Z),这减少到:

Cov(Y,S)+Cov(Y,Z|S)Cov(S,Z),

所以无偏因果估计是有偏处理的效果+工具的效果(controllingforthetreatmentcompliancerate.

但是,在排除限制的情况下,一旦我们对治疗进行控制,就不应该有仪器的影响。

一个例子,来自 Gelman 的芝麻街例子。首先,通过 2SLS 获得无偏的处理效果:

fit.2s <- lm(regular ~ encour, data = df)
watched.hat <- fit.2s$fitted
fit.2b <- lm(postlet ~ watched.hat, data = df)
summary(fit.2b)

这给出了答案,7.934。

现在,在 SEM 框架内:

library(foreign)
library(lavaan)
mod  <-
'
regular ~ a*encour
postlet ~ b*regular + c*encour
ind := a*b
total := a*b + c
'
fit <- sem(mod, data = df)
summary(fit)

 Regressions:
               Estimate  Std.Err  Z-value  P(>|z|)
  regular ~                                           
encour     (a)    0.362    0.051    7.134    0.000

  postlet ~                                           
  regular    (b)   13.698    2.079    6.589    0.000
  encour     (c)   -2.089    1.802   -1.160    0.246


  Defined Parameters:
               Estimate  Std.Err  Z-value  P(>|z|)
  ind               4.965    1.026    4.840    0.000
  total             2.876    1.778    1.617    0.106

13.698 - 2.089/.362 = 7.92

因此,无偏治疗效果不仅仅是有偏治疗效果的唯一原因是在控制治疗时仍然存在仪器的效果,根据排除限制不应该发生这种情况。

我在这里错过了什么吗?

1个回答

您正确地指出,在 LATE 式 IV 假设下,IV Z 对治疗 S、外生工具有因果影响,并且对结果 Y 没有直接影响,您的 S 对 Y 的治疗效果 B 被确定为

Cov(Y,Z)/Cov(S,Z)=ITT/ComplianceRate

这么清楚,

ITT=Cov(Y,Z),

并不是Cov(S,Z)Cov(Y,S)+Cov(Y,Z),正如你错误地陈述的那样。这也很直观,因为如果工具在治疗和结果方面是外生的,那么它的因果效应是确定的,并且(在线性下)只是工具和结果之间的相关性。

您似乎进一步暗示 IV 和 Y 在 Y 对治疗和 IV 的回归中应该是不相关的。如果治疗 S 实际上是内源性的,则情况并非如此。然后,它是一个对撞机,因为它是由 IV 和 Y 的未观察到的误差项引起的。处理条件使 IV 和误差项相互依赖,因此也依赖于 IV 和 Y。所以你得到一个非零即使排除限制有效,回归系数。如果您绘制因果图,这应该非常清楚。

如果不是这样,我们实际上可以测试排除限制,但是我们当然知道我们通常无法测试它!(至少不是那么容易)。