如何计算分位数处理效果?

机器算法验证 贝叶斯 模拟 因果关系 治疗效果
2022-04-09 04:08:55

考虑您已经为潜在结果定义了一个统计模型Yi(0)Yi(1)每个实验单元i=1,,N,如 Rubin (1978) 基于模型的因果效应推断 [另见 Rubin 和 Imbens (2015)]。您将模型拟合到数据并使用拟合模型来估算您未观察到的值并获得单位级别的处理效果:Yi(1)Yi(0). 在贝叶斯框架内,您通常会多次进行插补,从后验分布中绘制模型参数,以获得单位级治疗效果的分布(并因此计算平均治疗效果或 ATE)。

如果您对分位数处理效果 (QTE) 感兴趣,您可以通过两种方式进行。

  • 您可以计算所需的分位数N模拟的Yi(0)Yi(1)然后拿差价Q(Yi(1))Q(Yi(0)).

  • 或者,您可以计算单位级处理效果的分位数:Q(Yi(1)Yi(0)).

我见过人们将这两个量视为可互换的,但我相信它们有非常不同的解释。关于如何解释这些数量的任何想法?谢谢

1个回答

我认为在同质治疗效果世界这样的环境中它们将是相同的(Y1=Y0+m) 甚至是仿射变换 (Y1=kY0+m)保持等级(即,k>0),但通常它们不会重叠,因此您的担忧是有效的。

第二个肯定是更有趣的反事实量,但人们往往会计算第一个,因为他们缺乏个人层面的反事实数据来计算第二个量(或填充它的模型)。如果您不担心排名颠倒,那么这条捷径是有道理的请注意,这个问题不会出现在手段上。

要查看两者之间的差异,假设Y0关于 0 对称(比如说N(0,1)), 和Y1=kY0我们关心的是 95%。治疗效果的第 95 个百分位非常大,因为那些人​​是从负面底部走出来的。Y0分布到正顶部Y1. 但是如果两个 95% 之间的差异会更小k不是太大。如果支持率缩水,甚至可能是负面的Y1(说为k=0.5上),导致您对效果的第 95 个百分位数的符号做出错误的推断(远低于其大小)。

如果处理是一个很小的变化,您可能愿意假设两种方法之间的联系不成立的等级反转或高度非线性变换。

这是一个玩具示例,说明了最后一个示例Y0N(0,1)Y1=0.5Y0+0. 我已经绘制了分布Y0,Y1Y1Y0,以及每个的第 95 个百分位。如您所见,效果的第 95 个分位数是2.5,而第 95 个分位数之间的差异是0.821.59=0.77.

在此处输入图像描述