有人可以阐明线性与非线性混合效应吗?

机器算法验证 r 回归 随机效应模型
2022-02-15 03:44:01

我即将深入学习 R,我的学习项目将需要对数据集应用混合或随机效应回归,以开发预测方程。我在这篇文章中分享了作者的关注 如何为混合效果模型选择 nlme 或 lme4 R 库?想知道 NLME 还是 LME4 是更适合自己熟悉的软件包。一个更基本的问题是:线性和非线性混合效应建模之间有什么区别?

作为背景,我在我的 MS 研究中应用了 ME 建模(在 MATLAB 中,而不是在 R 中),所以我熟悉如何处理固定变量和随机变量。但我不确定我所做的工作是否被认为是线性或非线性 ME。它只是所用方程的函数形式,还是其他什么?

2个回答

线性和非线性回归模型之间有几个区别,但主要的数学区别是线性模型在参数上是线性的,而非线性模型在参数上是非线性的。R 包的作者 Pinheiro 和 Bates (2000, pp. 284-285)nlme优雅地描述了模型选择中更实质性的考虑:

在选择回归模型来描述响应变量如何随协变量变化时,总是可以选择使用参数线性的模型,例如多项式模型。通过增加多项式模型的阶数,可以在观察到的数据范围内越来越准确地逼近真实的(通常是非线性的)回归函数。这些经验模型仅基于观察到的响应和协变量之间的关系,不包括关于产生数据的潜在机制的任何理论考虑。另一方面,非线性模型通常是机械的,即基于产生响应的机制的模型。因此,非线性模型中的模型参数通常具有自然的物理解释。即使根据经验得出,非线性模型通常也包含数据的已知理论特征,例如渐近线和单调性,在这些情况下,可以将其视为半机械模型。与竞争对手的线性模型(例如多项式)相比,非线性模型通常使用更少的参数,从而对数据进行更简洁的描述。与多项式模型相比,非线性模型还可以为超出观察数据范围的响应变量提供更可靠的预测。对数据进行更简洁的描述。与多项式模型相比,非线性模型还可以为数据观察范围之外的响应变量提供更可靠的预测。对数据进行更简洁的描述。与多项式模型相比,非线性模型还可以为数据观察范围之外的响应变量提供更可靠的预测。

nlme 和 lme4 软件包之间也存在一些超出线性问题的重大差异。例如,使用 nlme 您可以拟合线性或非线性模型,并为任一类型指定组内误差的方差和相关结构(例如,自回归);lme4 做不到。此外,随机效应可以在任一包中固定或交叉,但在 lme4 中指定和建模交叉随机效应更容易(并且计算效率更高)。

我建议首先考虑 a) 是否需要非线性模型,以及 b) 是否需要指定组内方差或相关结构。如果这些答案中的任何一个是肯定的,那么您必须使用 nlme(鉴于您坚持使用 R)。如果您经常使用具有交叉随机效应的线性模型,或者嵌套和交叉随机效应的复杂组合,那么 lme4 可能是更好的选择。您可能需要学习使用这两个软件包。我首先学习了 lme4,然后意识到我必须使用 nlme,因为我几乎总是使用自回归错误结构。但是,当我分析来自交叉因素的实验数据时,我仍然更喜欢 lme4。好消息是我学到的关于 lme4 的很多东西都很好地转移到了 nlme。无论哪种方式,

参考

Pinheiro, JC 和 Bates, DM (2000)。S 和 S-PLUS 中的混​​合效应模型纽约:施普林格出版社。

对于线性-非线性部分,请参阅:关于该主题的 CrossValidated 文章,尤其是 Charlie 的第二名答案。我认为在处理混合效果时没有任何变化。