我想使用 lme4、nlme、baysian 回归包或任何可用的来拟合混合模型。
Asreml-R 编码约定中的混合模型
在进入细节之前,我们可能想要了解有关 asreml-R 约定的详细信息,以供不熟悉 ASREML 代码的人使用。
y = Xτ + Zu + e ........................(1) ;
通常的混合模型,y 表示 n × 1 的观测向量,其中 τ 是固定效应的 p×1 向量,X 是一个 n×p 的全列秩设计矩阵,它将观测与固定效应的适当组合相关联, u 是随机效应的 q × 1 向量,Z 是将观察与随机效应的适当组合相关联的 n × q 设计矩阵,e 是残差的 n × 1 向量。模型(1)称为线性混合模型或线性混合效应模型。假设
其中矩阵 G 和 R 分别是参数 γ 和 φ 的函数。
参数 θ 是一个方差参数,我们将其称为尺度参数。
在具有多个残余方差的混合效应模型中,例如在分析具有多个部分或变量的数据时,参数 θ 固定为 1。在具有单个残差方差的混合效应模型中,θ 等于残差方差 (σ2)。在这种情况下,R 必须是相关矩阵。Asreml 手册(链接)中提供了有关模型的更多详细信息。
误差的方差结构:随机效应的 R 结构和方差结构:可以指定 G 结构。
asreml() 中的方差建模重要的是要了解通过直接乘积形成的方差结构。通常的最小二乘假设(以及 asreml() 中的默认值)是它们是独立同分布 (IID)。但是,如果数据来自一个现场实验,其排列在一个 r 行 x c 列的矩形阵列中,例如,我们可以将残差 e 排列为一个矩阵,并可能认为它们在行和列内是自相关的。将残差写为一个按场序排列的向量,也就是说,通过对列内的残差行(块内的图)进行排序,残差的方差可能是
分别是行模型(阶 r,自相关参数 ½r)和列模型(阶 c,自相关参数 ½c)的相关矩阵。更具体地说,对于现场试验分析中的常见错误,有时会假设二维可分离自回归空间结构 (AR1 x AR1)。
示例数据:
nin89 来自 asreml-R 库,其中不同的品种在矩形场的复制/块中生长。为了控制行或列方向的额外可变性,每个图都被称为行和列变量(行列设计)。因而这种行列设计带有阻塞。产量是测量变量。
示例模型
我需要与 asreml-R 代码等效的东西:
简单的模型语法如下所示:
rcb.asr <- asreml(yield ∼ Variety, random = ∼ Replicate, data = nin89)
.....model 0
线性模型在固定(必需)、随机(可选)和 rcov(误差分量)参数中指定为公式对象。默认为简单误差项,不需要像模型 0 中那样正式指定误差项.
这里的品种是固定效应,随机是复制品(块)。除了随机和固定项,我们还可以指定误差项。此模型中默认为 0。模型的残差或误差分量通过 rcov 参数在公式对象中指定,参见以下模型 1:4。
下面的模型 1 更复杂,其中同时指定了 G(随机)和 R(错误)结构。
型号 1:
data(nin89)
# Model 1: RCB analysis with G and R structure
rcb.asr <- asreml(yield ~ Variety, random = ~ idv(Replicate),
rcov = ~ idv(units), data = nin89)
这个模型相当于上面的模型0,并且引入了G和R方差模型的使用。这里的选项 random 和 rcov 指定 random 和 rcov 公式来明确指定 G 和 R 结构。其中 idv() 是 asreml() 中标识方差模型的特殊模型函数。表达式 idv(units) 将 e 的方差矩阵显式设置为缩放单位。
# 模型2:单向相关的二维空间模型
sp.asr <- asreml(yield ~ Variety, rcov = ~ Column:ar1(Row), data = nin89)
nin89 的实验单元由 Column 和 Row 索引。所以我们期望两个方向的随机变化 - 在这种情况下是行和列方向。其中 ar1() 是指定 Row 的一阶自回归方差模型的特殊函数。此调用为误差指定了一个二维空间结构,但仅在行方向具有空间相关性。列的方差模型是恒等式 (id()),但不需要正式指定,因为这是默认值。
# 模型3:二维空间模型,双向误差结构
sp.asr <- asreml(yield ~ Variety, rcov = ~ ar1(Column):ar1(Row),
data = nin89)
sp.asr <- asreml(yield ~ Variety, random = ~ units,
rcov = ~ ar1(Column):ar1(Row), data = nin89)
类似于上述模型 2,但相关性是两个方向 - 自回归一个。
我不确定这些模型中有多少可以使用开源 R 包。即使这些模型中的任何一个的解决方案都会有很大帮助。就算是+50的奖励也能刺激,开发这样的包也会有很大的帮助!
请参阅 MAYSaseen 提供了每个模型和数据的输出(作为答案)以进行比较。
编辑:以下是我在混合模型讨论论坛中收到的建议: “您可以查看 David Clifford 的回归和空间协方差包。前者允许拟合(高斯)混合模型,您可以非常灵活地指定协方差矩阵的结构(例如,我将它用于谱系数据)。spatialCovariance 包使用回归来提供比 AR1xAR1 更精细的模型,但可能适用。您可能需要与作者通信才能将其应用于您的确切问题。