如何统计检验数据中是否存在嵌套效应?

机器算法验证 相关性 聚类 类内相关
2022-04-09 10:37:22

我有一个样本,其中包括 52 所学校中的所有学生,这些学生被随机分配为治疗组或对照组(我们进行了分组随机试验,其中每所学校的所有学生都被分配到治疗组或对照组)。我想知道这个数据是否有学校聚类效应。换句话说,我想将学生的校内变异性与学校之间的变异性进行比较。衡量是否存在学校聚类效应的一种方法是使用 ICC(班级内相关性)。我的数据(以学校为聚类单位)的 ICC 为 0.04。我想要一种统计方法来帮助我确定 0.04 的 ICC 是否足够大以在我的模型中考虑学校聚类效应。你会推荐什么?F 检验学校之间的变异性与学校内的变异性之比能否回答这个问题?

谢谢你在这个问题上帮助我。

1个回答

目标:计算 ICC 并测试结果 ICC 是否足够大以解释研究中的聚类效应。

我的研究: 52 所学校的所有学生在三年内进行了纵向跟踪。学校被随机分配到治疗组或控制组。我的问题是我们需要考虑学校集群效应吗?

ICC是一种可以帮助我们判断聚类效应是否重要的​​度量。

如何计算ICC?

1)查看没有人使用治疗的基线年的学生分数并计算:

MSbetween/(MSbetween+MSErr)

2)另一种方法是通过使用随机效应模型框架和使用随机效应的方差(对于学校)来计算ICC。这是最常见的不同组大小的方法。在这种情况下,ICC 是

σb2/(σb2+σe2)
在哪里σb2是随机效应的方差和σe2是残差方差。

如何在 R 中拟合随机效应模型?

library(nlme)
schRandModel <- lme(StudScoresBaseline ~ 1, data = data, random = ~ 1 | SCHOOL)
SchRandModel.LogLiklihood <- schRandModel$logLik

上面的模型假设学校是随机截距的。现在我们拟合没有学校的模型作为随机效应(组是学生而不是学校):

simpleModel <- lme(StudScoresBaseline ~ 1, data = data, random = ~ 1 | StudentID)
simpleModel.LogLiklihood <- simpleModel$logLik

最后,使用似然比检验,我们检验似然之间的差异:

logLikDiff = SchRandModel.LogLiklihood-simpleModel.LogLiklihood
1-pchisq(2*logLikDiff,df=1)

我得到的 p 值小于 <0.0001,表明我们有足够的证据表明随机效应模型更适合。因此,学校集群效应在本研究中很重要。

感谢Macro指导我一步一步写出答案。