一级预测器离散时多级模型中的截取解释

机器算法验证 多重回归 混合模式 重复测量 回归系数 多层次分析
2022-04-17 14:29:33

这是实验设置:

1 个因变量(离散,4 个水平)和

3 自变量:

  • 时间,对象内测量,5 个离散级别
  • 协变量,受试者内测量,5 个离散水平
  • 治疗,在受试者之间测量,5 个离散水平

研究问题:治疗对因变量有什么影响?

我计划使用多级回归模型,其中我首先回归时间和结果变量(level1)的协变量,然后使用生成的回归系数作为第 2 级的因变量,如下所示:http://joophox。 net/mlbook2/Chapter2.pdfhttps://en.wikipedia.org/wiki/Multilevel_model

级别 1:结果 = b0 + b1 * 时间 + b2 * 协变量 +e

级别 2:b0 = g0 + g1 * 治疗 + u 和 b1 = g0 + u

据我了解,系数 g1 可以回答我的研究问题。如果它很重要,那么治疗会对结果产生影响。

现在我遇到了拦截 b0 的问题。b0 是预测变量 = 0 时结果的平均值。但是,我的时间变量是离散的,分 1-5 步。我很难想象我如何才能让它变得有意义,这样它在第二层才有意义。如果我以时间为中心,那么我得到 (-2,-1,0,1,2),所以本质上只是第三个时间点的平均结果?但是,要使 2 级回归有意义,我需要的是(我认为)所有时间点的结果变量的平均值。

我的推理是否存在逻辑错误?

1个回答

如果它很重要,那么治疗会对结果产生影响。

这个说法有点问题。如果 p 值是 0.049999,这意味着如果结果组和治疗之间实际上没有关联,那么获得这个结果或更极端的结果的概率是 0.049999。但是,如果 p 值为 0.0500001,这意味着如果结果组和治疗之间实际上没有关联,那么获得该结果或更极端的结果的概率为 0.0500001。现在,如果您的显着性水平为 0.05,则在第一种情况下,您会声称“治疗对结果有影响”。在第二种情况下,您不会。但是,结果基本相同。因此,最好不要依赖 p 值来声称存在“效果”。

另外,我建议您完全避免使用“效果”一词,因为人们通常会将其解释为因果关系。您发现的是一种关联,它在某个任意级别上可能重要也可能不重要。

至于主要问题,在这种情况下将时间居中是一个好主意,以便更有意义地解释截距:

如果我以时间为中心,那么我得到 (-2,-1,0,1,2),所以本质上只是第三个时间点的平均结果?

是的,前提是变量是数字而非分类变量。

但是,要使 2 级回归有意义,我需要的是(我认为)所有时间点的结果变量的平均值。

这不太有意义,但这取决于您的其他变量是什么。您说它们是“离散的”,但这是否意味着它们是整数 1、2、3、4(如时间变量),或者它们是分类的,例如“蓝色”、“绿色”、“黑色”?在前一种情况下,它与时间相同,因此当变量为 0 时,截距将是结果的平均值,如果这是有道理的,您可以保持原样 - 否则居中会更好。但是,在后一种情况下(分类),如果您正在使用的软件使用对比编码,这通常是默认设置)截距是分类变量处于其参考水平时结果的平均值,