边际模型与随机效应模型——如何在它们之间进行选择?给外行的忠告

机器算法验证 混合模式 随机效应模型 咕噜咕噜 广义估计方程 边际模型
2022-03-20 05:05:03

在搜索有关边际模型随机效应模型以及如何在它们之间进行选择的任何信息时,我发现了一些信息,但它或多或少是数学抽象解释(例如这里:https://stats.stackexchange .com/a/68753/38080)。在某个地方,我发现这两种方法/模型(http://www.biomedcentral.com/1471-2288/2/15/)之间的参数估计值之间存在显着差异,但是 Zuur 等人写的恰恰相反. (2009 年,第 116 页; http: //link.springer.com/book/10.1007%2F978-0-387-87458-6)。边际模型(广义估计方程方法)带来总体平均参数,而随机效应模型(广义线性混合模型)的输出考虑到随机效应 - 主题(Verbeke 等人,2010,第 49-52 页;http:/ /link.springer.com/chapter/10.1007/0-387-28980-1_16)。

我希望在非统计学家和非数学家熟悉的语言中用一些模型(现实生活)示例对这些模型进行一些外行的解释。

详细的,我想知道:

什么时候应该使用边际模型,什么时候应该使用随机效应模型?这些模型适用于哪些科学问题?

应该如何解释这些模型的输出?

1个回答

感谢您链接我的答案!我将尝试给出明确的解释。这个问题在本站已经讨论过很多次了(见右侧的相关问题),但是对于一个“外行”来说,确实是很困惑也很重要。

首先,对于线性模型(连续响应),边际模型和条件(随机效应)模型的估计是一致的。所以我将专注于非线性模型,尤其是二元数据的逻辑回归。

科学问题

区分边际模型和条件模型的最常用示例是:

如果您是一名医生,并且想要估计他汀类药物会降低患者心脏病发作几率的程度,那么 特定主题的系数是明确的选择。另一方面,如果您是州卫生官员,并且您想知道如果高危人群中的每个人都服用染色药物,死于心脏病的人数将如何变化,您可能希望使用人口——平均系数。(艾莉森,2009)

这两种科学问题对应于这两种模式。

插图

如果我们将协变量从“他汀类药物”更改为“时间”,我到目前为止看到的最好的说明是应用纵向分析中的下图(Fitzmaurice,Laird and Ware,2011 年,第 479 页)。很明显,这两个模型的系数尺度不同,这可以从本质上解释为随机变量的非线性函数的均值不等于均值的非线性函数。

在此处输入图像描述

解释

在上图中,虚线来自随机截距模型。说明在解释固定效应时需要控制随机效应常数,即在解释斜率时只走一条线。这就是为什么我们将随机效应模型的估计称为“特定主题”。具体来说,

  • 对于条件模型,解释是,对于给定的主题,对数几率会如何随着时间的单位变化而变化?(参见 Fitzmaurice、Laird 和 Ware(2011 年)第 403 页关于为什么条件模型中对时不变协变量的解释可能具有误导性的讨论。)
  • 对于边际模型,解释与线性回归的解释完全相同,即对数优势将如何随着时间的一个单位变化而变化,或者药物与安慰剂的对数优势比。

这个网站上还有另一个例子