为了扩展我的评论,这是一种方法。更习惯于您工作的领域的人(这里有很多人)可能对解决相同的问题有更好的建议:
1)假设混杂变量有两种。
i)第一种(主要的)是共同创始人,对于给定的主题总是相同的。例如,“学校效应”和“教师效应”以及社会经济变量可以合理地假设在每个科目之前和之后是相同的
ii)第二种(对于您的问题可能不存在)可以在受试者中发生变化(这些将是与时间相关的事情,例如之前已经测试过的“学习效果”,而不是干预本身)
2)假设没有混杂因素与您感兴趣的任何影响相互作用
反映这一点的模型可以写成如下:
让代表主题,让代表时间(0/1)。令为主题在时间的响应。治疗组变量为,对照组为itYititTreatment10
αi包含上述所有个人级别的联合创始人。
γ包含任何时间联合创始人,包括第一轮测试的效果。
β包含治疗效果 - 差异
Yit=αi+γ⋅t+β Treatment⋅t+εit
通常对于这样的模型,我很想使用具有随机截距的混合效应模型,但在这种情况下,您没有随机化。尽管如此,由于之前/之后的配对,假设混杂因素与治疗没有相互作用,您可以梳理出治疗效果。
例如,如果你取,你会得到:Di=Yi1−Yi0
Yi1=αi+γ+β Treatment+εi1
Yi0=αi+0+0+εi0
Di=γ+β Treatment+ηi
其中。ηi=εi1−εi0
然后 - 假设样本量足够大,的总体平均值相等的直接两个样本测试应该可以说是获得治疗效果。D