ICC在多级建模中的使用

机器算法验证 回归 混合模式 多层次分析 随机效应模型 类内相关
2022-03-04 14:08:31

我最近刚开始学习 ICC 和多级模型,有人告诉我,确定 MLM 是否有必要的一种方法是检查 ICC 的大小。我很难理解为什么 ICC 是您是否应该运行 MLM 的一个很好的指标

据我了解,ICC 告诉您集群/组之间有多少可变性。如果 ICC 很大,那么您的集群之间存在很大的可变性,您应该分别对待它们,允许随机截距或随机斜率

如果您对运行随机截距模型感兴趣,我可以理解为什么 ICC 可能有用。集群之间的高度可变性可能表明它们具有不同的均值和可能不同的截距,因此我们运行一个 MLM,它允许每个集群有不同的截距

但是 ICC 是否告诉您有关每个集群的不同斜率的可能性?我不能完全理解斜率与 ICC 返回的值之间的关系。如果 ICC 很小,则意味着集群之间的变异性很小,这可能表明它们的均值相似,因此可能不需要随机截距模型,但这是否自动意味着随机斜率模型也不需要?

1个回答

ICC(类内相关)对于随机截距模型是可解释和有用的。它是同一簇内的两个观测值之间的相关性。集群内的相关性越高(即 ICC 越大),集群内的变异性越低,因此集群之间的变异性就越高

或者,它也是衡量每个级别有多少变化的指标,这就是为什么它也被称为方差分配系数 (VPC)。

因此,正如您正确指出的那样,在随机截距模型中,当 ICC 很大时,这是有利于保留随机截距的证据,而当它很小时,这是有利于丢弃随机截距的证据。然而,正如应用统计中经常出现的情况一样,决定“小”和“大”的因素是特定于上下文和特定学科的。

一旦我们引入随机斜率/系数,事情就会变得更加复杂。ICC 不再与 VPC 相同,因为 ICC 将是指定随机斜率的变量的函数。因此,如果所讨论的变量是连续的,ICC 的值可以是无限数量的,如果它是分类的或计数的,则与级别的数量一样多。因此,在随机斜率模型中对 ICC 的任何解释都变得更加困难。例如,Stata 将为 ICC 计算单个值,但在随机斜率模型中,这伴随着警告:

注意:ICC 以随机效应协变量的零值为条件。

换句话说,它已经根据随机斜率变量的零值计算了 ICC,因此对 ICC 的任何解释也基于斜率变量的零值。

关于你的问题:

如果 ICC 很小,则意味着集群之间的变异性很小,这可能表明它们的均值相似,因此可能不需要随机截距模型,但这是否自动意味着随机斜率模型也不需要?

不,因为每个集群有可能具有相同的截距(没有随机截距),而斜率确实可能不同,我们可以像这样可视化:

在此处输入图像描述

如果我们想知道数据是否支持随机斜率,一种方法是拟合具有和不具有随机斜率的模型,并使用似然比检验。