具有不平衡设计和非独立数据的线性混合模型非独立数据?

机器算法验证 时间序列 混合模式 lme4-nlme 非独立的
2022-04-19 03:52:53

我是尝试建立混合模型的新手,我想要一些关于我的模型设计的输入。

我一直在重建一些植物的年龄,并且每年我都在测量它们的生产力。所以我有一个包含 580 株植物的设计,每株植物都有一个年龄(从 4 到 25 年不等),并且每年我都有一个生产力测量值。我想看看生产力如何与温度变化相关。

因此,通过这个实验设计,我面临两个主要问题:

  1. 在每个工厂内,年份之间的测量值是非独立的
  2. 每个植物都有不同的时间范围(最少 4 个,最多 25 个)

我首先尝试了一个 LMM 模型,将变量“植物”拟合为随机效应,以说明每个植物中数据的非独立性。所以我的模型有以下形式:

model1 <- lmer(Productivity ~ Temperature + (1|Plant), data=data)

作为第二步,我想以某种方式包括每个植物都有不同的时间范围的事实……所以,我包括了嵌套在植物中的因素年。

所以第二个模型的形式是:

model2 <-lmer(Productivity ~ Temperature + (1|Plant:Year),  
              data=data)

这些模型之间的结果确实不同,所以我不确定哪一个更好地封装了我的实验设计。我不太确定嵌套因素,因为在某些情况下植物之间的年份是一致的……

1个回答

你这么说

嵌套在 Plant 中的因子 Year

如果Year嵌套在Plant. 在这种情况下,moel 应该是

lmer(Productivity~Temperature +(1|Plant/Year),data = data)

或等效地:

lmer(Productivity~Temperature +(1|Plant) + (1|Plant:Year),data = data)

所以,澄清一下,这意味着每个都Year属于一个,并且只属于一个Plant所以第 1 年可能属于植物 1,而第 2 年也可能属于植物 1,这意味着对于每一年,只有一个植物被测量。例如,对于第 3 年,这可能属于工厂 2(但不属于工厂 1)。嵌套结构看起来像

        Plant1             Plant2             Plant3
       /     \            /      \            /     \
    Year1  Year2        Year3  Year4        Year5  Year6


编辑:从评论中可以看出设计部分交叉(部分嵌套)。这可能看起来像

        Plant1     Plant2   Plant3
          /\      /  \   \ / \  
         /  \    /    \   X   \         
        /    \  /      \ / \   \
    Year1    Year2   Year3  Year4

在这种情况下,适当的随机结构是:

lmer(Productivity~Temperature + (1|Plant) + (1|Year), data = data)

有关嵌套和交叉随机效应的更多详细信息,请参见此处:
交叉与嵌套随机效应:它们有何不同以及如何在 lme4 中正确指定?