您将如何模拟这种随机效应结构?

机器算法验证 r 混合模式 随机效应模型 lme4-nlme
2022-04-06 07:38:14

我有一种奇怪而复杂的模型设计,我想就如何最好地对错误结构进行建模征求您的意见。

我有 100 个站点,每个站点属于 4 种不同森林类型类别中的 1 个(因此每种森林类型 25 个)。在每个站点中,我有 4 个地块,每个地块都有不同的操作处理。结果是每个地块内的新幼苗数量。我对森林类型、处理方法及其相互作用如何影响幼苗生长感兴趣。

所以,我能想到的最基本的模型是(使用nlme):

lme(seedling ~ forest.type + treatment + 
               forest.type*treatment, random=~1|site)

这种似乎是正确的,因为每个站点可能对幼苗数量有一些随机影响。但这似乎也不完全正确,因为治疗嵌套在站点内,随机截距可能因治疗而异。所以我想到的另一个模型是:

lme(seedling ~ forest.type + treatment + 
    forest.type*treatment, random=~1+treatment|site)

而且,虽然模型适合(尽管lmer甚至拒绝尝试),但它似乎也不完全正确,因为我没有在站点内复制任何治疗。

我知道所有地块的地理位置,所以我也尝试了一些模型,它们只使用空间相关的误差结构来代替随机效应,但我无法知道处理是否会影响相关性,所以我不知道对这种方法感觉不太舒服。

以上这些模型中的任何一个似乎都合适吗?还是您建议使用不同的模型或不同的方法?

1个回答

这与经典的裂区设计非常相似。

森林类型是四个级别的固定效果。将森林类型随机分配给站点有点牵强。相反,站点是嵌套在森林类型中的随机效应。

治疗是具有三个级别的固定效应。

地块是嵌套在站点中的随机效应(嵌套在森林类型中)。在这种情况下,地块是由处理组合的站点唯一标识的。

形式上,通过治疗相互作用的部位也将是随机效应。在这种情况下,它与地块间的变异性和误差方差相混淆。

森林类型的测试将使用站点术语。站点的估计将包括站点到站点的差异σsite2以及在准备每个站点时引入的任何可变性。

处理和森林类型相互作用处理的测试将按处理项使用站点。按处理项对站点的估计将包括样地间方差σplot2, 治疗差异的部位σsite×treatment2, 和误差方差σerror2.

一般来说,我还没有一个好的方法来获得这些统计分析的正确预期均方和自由度。对于这种设计,使用包计算分层误差方差可能是可行的。

我的看法是forest.type应该用 3 和 96 自由度treatment进行测试,应该用 3 和 288 自由度进行测试,以及forest.type:treatment用 9 和 288 自由度进行测试。

看起来nlme会对固定效应产生正确的分析:

lme(seedling ~ forest.type + treatment + forest.type*treatment, random=~1/forest.type/site)