考虑 lme4 中的分组随机效应

机器算法验证 r 混合模式 lme4-nlme 重复测量 随机效应模型
2022-04-02 23:05:17

我正在编辑我的问题,因为它不够详细。我做了一个(不成功的)捷径。对不起,这是整个故事。

在我的实验中,我测试了受试者对某些(模拟)情况的反应。受试者阅读场景,然后专家评估受试者的行为。评价范围从1到5。有10个不同的模拟,每个科目都参加;因此,从每个主题我有 10 个数据点。我的实验进行了 30 天。每天使用相同的 10 次模拟。换句话说,在每一天,主题和模拟都是完全交叉的。每天的模拟都是不同的。

有 3 类模拟(A、B 和 C)。从理论的角度来看,这些类别彼此不同。A类通过3次模拟(a1、a2、a3)进行测试;B乘3(b1,b2,b3);C乘4(c1,c2,c3,c4)。第 1 天的 a1:c4 与第 2 天的 a1:c4 不同,依此类推。重要的是,参与者只参加了一次实验,不允许再次参加。也就是说,如果参与者参加,比如说第 1 天,他将参加第 1 天的 10 次模拟。但他再也不能参加了。

这三个类别是我唯一感兴趣的。从这个意义上说,我认为它们应该被视为固定效应。每个类别都通过一些模拟进行测试/表示。然而,对于每个类别,都有无限可能的模拟,我只是抽样了一些。从这个意义上说,模拟是随机的。

我在这里感兴趣的唯一问题是关于学科性别对成绩的影响。我想控制所有其他参数。我的问题是如何解释模拟和类别。我想将我的结果外推到参与者和代表该类别的模拟之外。然而,性别也有可能与类别或模拟相互作用。

所以这是一个“基本”模型:

lmer(grade ~ gender + (1|subject) + (1|simulation:day), data = My_data)

然而,该模型并未考虑性别对模拟产生不同影响的可能性。所以这是另一个尝试。

lmer(grade ~ gender + (1|subject) + (1 + gender|simulation:day), data = 
My_data)

我在这里卡住了。类别如何发挥作用?我需要输入它作为固定效果吗?如果是,那么模拟呢?以下内容有意义吗?

lmer(grade ~ gender*category + (1 + category|subject) + (1 + 
gender|simulation:day), data = My_data)

还是放弃模拟,将类别视为随机更好?但在这种情况下,对于给定的一天,同一类别将针对每个主题出现多次(例如,A 将出现 3 次)。这不是问题吗?如下:

lmer(grade ~ gender + (1 + subject) + (1 + gender|category), 
data =My_data)

最后一点:我有很多数据(数千名参与者),所以收敛应该不是问题。

非常感谢您的帮助

4个回答

几点:

  • 如果我理解正确,您的响应变量是一个等级,范围从 1 到 5。这是一个等级相对较少的序数变量。因此,假设残差的正态分布可能不合适。您可以考虑使用序数数据的混合模型,例如延续比率模型。
  • 你是对的,subject而且simulation似乎是完全交叉的因素。因此,要考虑的可能模型是:

    grade ~ category * gender + (1 | subject) + (1 | simulation) 
    

如果您认为不同的类别在测量方面有所不同,并且您想对此进行测试,则需要将类别建模为带有 (1|category) 的随机截距。

但是,我认为我们需要更多信息来了解您实际想要决定的内容。例如,您是否想知道每个人对他们的衡量方式是否不同?或者如果每个刺激的测量方式不同?

似乎在模型中:

lmer(measure ~ category + (1|subject) + (1|stimulus), data = My_data)

category用于表示 的水平stimulus因此,这没有意义,因为category它不是实际变量。

尽管stimulus从某种意义上说它是随机的,它(可能)被随机分配给每个subject,但这并不意味着它应该作为随机效应包括在内 - 除非对 的治疗效果不感兴趣stimulus在这种情况下,您只需将方差划分为subject级别和stimulus级别。

实际上,您似乎更有可能对每个水平stimulus与结果之间的关联感兴趣 - 也就是说,您对治疗效果感兴趣,因此模型应采用以下形式:

measure ~ stimulus + (1|subject)

在您的设置中,主题刺激 似乎是完全交叉的随机分组因素 - 因为每个主题都会看到每个刺激,并且(我假设)您正在使用研究中包含的主题和刺激来代表您希望的所有主题和所有刺激将您的研究结果概括为。

这里的关键词是分组——为了让您的模型成为线性混合效应模型 (lmer),每个受刺激组合的受试者都应该像一个容器一样,将一组值组合在一起以用于您的测量结果。属于同一容器的所有测量值比属于不同容器的值更相似,因为它们受到相同的主题水平和刺激水平的影响(假设这些影响随着时间的推移是恒定的)。

可能会出现特定容器中的一组值,例如,如果您通过刺激组合或在两个或多个不同条件下等记录每个受试者在几个时间点的测量值。

如果您通过刺激组合对每个受试者只有一个测量值,那么您正在处理一个线性模型 (lm)。每个刺激组合没有根据每个受试者的观察分组,因此没有随机分组因素,这意味着没有任何影响可以在分组因素的水平组合中随机变化(即随机效应)。如果没有任何随机效应,就不可能有混合效应模型,因为这样的模型需要固定效应和随机效应都成为其中的一部分!

如果每个容器确实有多个测量值(即,按刺激组合的受试者),那么您的模型可以包括受试者级别的预测变量(例如,受试者性别、受试者年龄)和/或刺激级别的预测变量(例如,刺激类别) .