R中的混合效应模型或混合设计方差分析

机器算法验证 r 方差分析 重复测量 混合模式
2022-04-06 10:35:51

我想知道您是否可以快速就我的数据的最佳统计分析提出建议。

我有一个设计的实验,在一个较大的区域内有 12 个地块。该区域被分成 6 块以克服那里存在的自然梯度问题,因此每个块中有 2 个地块。

处理 1 是这 12 个地块之间的两级处理拆分,即每个块中的 1 个地块接受一个级别的处理(“高”),另一个接受另一个级别(“低”)。嵌套在其中,每个地块分为两个(24 个子地块),并给出第二个两级治疗 2(“A”级和“B”级)。每个接受处理 1 的小区都有一个处理 2 子小区接收级别“A”和一个子小区接收级别“B”。

因此,我有一个双向因子设计,有 4 种处理组合:高/A、高/B、低/A 和低/B。

该实验进行了三年,并且物种丰富度测量为每年的响应(对每个处理 2 子图中存在的物种数量的简单计数)。

在收到的治疗 1 水平的背景下,我有兴趣了解治疗 2 的两个水平对丰富度随时间变化的影响。

我不确定我是否需要:

  • 双向混合方差分析,具有受试者内效应(年份?)和受试者间效应(治疗 1 和治疗 2?)
  • 混合效应模型,治疗 1 和治疗 2 作为固定效应,年份和图作为随机效应。(年份是随机效应吗?我不确定……)。子图在这里也应该是随机效应吗?
  • 具有时间序列的混合效应模型。
  • 我也不确定如何处理块。Block没有处理水平,它只是试图降低由于研究区域的自然梯度而导致的地块之间相似性的发生率......
  • 此外,由于丰富度数据是对物种的计数,我不确定这是否会影响我对分析的选择......

如果您对其中任何一点有任何想法,我会很高兴听到他们的声音。

2个回答

所以我已经做了很多阅读和与人们聊天,我有一个解决方案。

我的实验设计是裂区设计,与嵌套或分层设计有很大不同。我最初混淆了这些条款。正如罗伯特在他的回答中正确指出的那样,需要一个混合效应模型。因此:

固定效果:年份、治疗 1、治疗 2

随机效应:年份、区块、治疗1

模型是这样指定的:

mod<- lmer(Richness~Treatment1*Treatment2*Year+(1|Block/Treatment1)+(1|Year),data=dat,poisson)

固定效应是括号中指定的术语。由于这些都不是连续的(Year 的影响不一定每年都以线性方式增加,所以我将其归类为分类固定效应),它们被指定为 1|固定效应,其中 1 表示截距。

如果 Block 实际上是一个连续的固定效应(显然是假设的!),那么可以指定固定效应 +(Block|Treatment1)+(1|Year)。

然后可以适当地简化模型。

需要注意的几点:

1) 当指定为随机效应时,Year 与 Block 和 Treatment1 分开列出,因为它没有直观的“级别”可以嵌套在它们之间(Year 在实验的任何地块大小上都没有任何不同:对于每个块,情节和子情节年份是相同的。

2) 治疗 2 不需要指定为随机效应,因为它代表了实验中最高水平的复制,因此不会被假复制

3) 在混合效应模型中,如果误差不正常,则可以指定误差分布。我在这里指定了泊松,因为我的响应数据是计数 - 这改善了模型残差的分布。

我的建议是使用混合效果模型

  • Treatment1 和 2 作为因子(固定效应)
  • Year作为区间尺度因子
  • Block作为随机因素

问:应该year被视为随机效应吗?

答:取决于您根据您的理论所期望的结果。我想物种的数量可能会随着时间的推移而增加,而且这种增加可能是线性的。那么你应该使用year作为一个因素。但是,如果有理由假设,例如,第一年几乎没有增长,第二年大幅增长,第三年再次增长很少,您可以考虑将year其用作固定因子。

问:“阻塞”应该如何处理?

A:我的理解是,街区之间的环境条件不同,但同一个街区的地块之间却没有。然后我建议添加block一个随机因素。

这对回答你的问题有帮助吗?