R中具有固定和随机因子的时间序列分析

机器算法验证 r 时间序列 方差分析
2022-03-25 13:47:36

我有一个数据集,我不确定如何分析。

数据集来自以下实验:我种植植物(2 种不同类型)并在不同时间点测量它们的高度(每株植物单独跟踪)。我总共有 3 个用来种植植物的盒子,每个盒子里有每种类型的 3 株植物。我在 4 个不同的时间点进行了测量。

所以,如果我没记错的话,植物类型是一个固定因素,而盒子是一个随机因素。

以下是它的结构:

time, box, type, height
1, 1, 1, 1.2
1, 1, 1, 1.3
1, 1, 1, 1.1
1, 1, 2, 1.4 
1, 1, 2, 1.5
1, 1, 2, 1.6
...
2, 1, 1, 1.2
2, 1, 1, 1.3
...
1, 2, 1, 1.2
1, 2, 1, 1.3    

我想知道使用 R检查不同植物类型之间是否存在差异的正确方法是什么

到目前为止,我所做的是:

lme1 <- lme(height ~ type, random= ~ 1|box, data=mydata)
anova(lme1)

但我不知道如何在分析中包含时间变量..

这是不同植物类型的高度随时间变化的图。每一行都是一株植物。

在此处输入图像描述

1个回答

对于时间序列的混合效应模型,我通常使用该nlme包,因为它提供了对自相关结构进行建模的工具。如果我不需要考虑自相关,我更喜欢这个lme4包,它为指定随机效应提供了更大的灵活性,而且通常也更快。

我建议阅读 Zuur 等人。2009 (ISBN 978-0-387-87457-9) 作为使用 R 进行混合效果建模的介绍。这本书包含许多使用该nlme包的漂亮和说明性示例。

根据您的问题和评论,您的模型结构应如下所示:

  • 固定效应:截距、植物类型(确保这是一个因子变量而不是 R 中的数字!)、时间和两者之间的相互作用
  • 随机效应:按嵌套在框中的植物分组的随机截距,也可能是具有相同嵌套结构的随机斜率与时间
  • 相关结构:某种以时间为协变量的自回归移动平均相关结构,与随机效应相同的分组结构

因此,一个完整的模型可能如下所示fit1 <- lme(height ~ type * time, random= ~ 1|box/plant, correlation=corARMA(0.2, form=~time|box/plant, p=1, q=0), data=mydata)anova如果包含随机斜率可以改进模型,您应该使用该函数通过比较模型来进行测试。您还应该测试哪种自相关结构最合适(尽管 Zuur 等人建议不要花费太多精力来寻找最佳自相关结构)。当然,还需要研究残差图。如果模型存在异方差,您可能需要指定方差结构或转换依赖项。从情节来看,高度和时间之间的关系非常线性,但您也可以尝试转换时间。

潜在问题:您的时间点数量极少,这可能会导致在尝试拟合自相关参数时出现问题。甚至不可能适合它们。此外,您的个人和盒子的数量非常少。