我最近对倾向得分产生了兴趣。我一直在使用 F. Thoemmes 博士创建的 SPSS 工具来计算使用双变量“治疗”变量(例如抑郁症)和几个协变量(例如年龄、性别、家庭成员)的倾向得分。然后我得到一个结果倾向得分,但我想知道如何处理它。
我已经读过,典型的做法是匹配倾向得分几乎相同的两个人(例如,两个人的组号为“17”),但他们的治疗变量(例如抑郁症)实际上不同,然后进行配对基于组数和因变量(例如家庭收入)的 t 检验。在此示例中,我们将看到具有相同倾向(例如,年龄、性别、家庭成员)但在您的治疗变量上不同的两个人实际上在您的受抚养人上是如何不同的。
这个想法对我来说很有意义,但是该软件实际上并没有根据倾向得分进行匹配,而且我不知道如何使用 SPSS 或 Excel 来匹配它们,我目前不想费心去学习如何这样做在另一种程序/语言(例如,R)中。这种懒惰,姑且称之为,迫使我做更多的研究。
两位作者指出:“匹配完成后,匹配的样本可能会通过非配对 t 检验进行比较。(“匹配”错误地表明应将结果数据视为匹配对进行分析。处理和未处理的样本应然而,被认为是独立的,因为没有理由相信匹配个体的结果以任何方式相关)。” (谢弗和杭,2008)。其他研究似乎表明人们经常在他们感兴趣的自变量旁边输入逻辑回归中的倾向得分,并查看自变量如何在“倾向”受到控制的情况下进行预测。
尽管这一研究方向很有趣,但我必须承认,在倾向得分计算之后,在进行定量分析方面,哪些方法是可能的/最好的,我有点迷茫。任何有关此事的指导将不胜感激。我可能还会有后续问题!
编辑:我想强调的是,在我为每个人计算出倾向得分后,我担心要进行哪些类型的推理分析。例如,也许我可以根据协变量(年龄、家庭人数、吸烟、性别、州)计算抑郁倾向得分(是,否)。该程序计算倾向得分作为每个人的新变量。在此之后,我有兴趣查看抑郁症是否与家庭收入相关,同时“控制”/“考虑”/“匹配”(可能根据您建议的方法选择单词)与倾向相关的影响。