我认为在同质治疗效果世界这样的环境中它们将是相同的(Y1=Y0+m) 甚至是仿射变换 (Y1=k⋅Y0+m)保持等级(即,k>0),但通常它们不会重叠,因此您的担忧是有效的。
第二个肯定是更有趣的反事实量,但人们往往会计算第一个,因为他们缺乏个人层面的反事实数据来计算第二个量(或填充它的模型)。如果您不担心排名颠倒,那么这条捷径是有道理的。请注意,这个问题不会出现在手段上。
要查看两者之间的差异,假设Y0关于 0 对称(比如说N(0,1)), 和Y1=−k⋅Y0我们关心的是 95%。治疗效果的第 95 个百分位非常大,因为那些人是从负面底部走出来的。Y0分布到正顶部Y1. 但是如果两个 95% 之间的差异会更小k不是太大。如果支持率缩水,甚至可能是负面的Y1(说为k=0.5上),导致您对效果的第 95 个百分位数的符号做出错误的推断(远低于其大小)。
如果处理是一个很小的变化,您可能愿意假设两种方法之间的联系不成立的等级反转或高度非线性变换。
这是一个玩具示例,说明了最后一个示例Y0∼N(0,1)和Y1=−0.5⋅Y0+0. 我已经绘制了分布Y0,Y1和Y1−Y0,以及每个的第 95 个百分位。如您所见,效果的第 95 个分位数是2.5,而第 95 个分位数之间的差异是0.82−1.59=−0.77.
