如何在两组比较或回归中解释同一个人的多次测量?

机器算法验证 回归 混合模式 聚类 多层次分析 假设
2022-04-12 23:53:08

我正在对从患者那里收集的临床数据进行分析,这些数据与时间(纵向)相关,或者更常见的是同一人同时进行的不同测量(例如,测量每只眼睛的变量)。

我的问题是在我运行统计数据时考虑这种相关性,因为上述内容违反了我观察的独立性。

我遇到了混合效果模型,我现在已经阅读了很多,我认为这就是我需要的。因此,我将在任何回归中包括双眼,但将人添加为随机效应。

然而,阅读更多关于这个主题的内容,似乎有“聚类相关的方差稳健估计”(我相信这在 STATA 中很流行),以及多个主题谈论“聚类标准误差”或“分层建模”,坦率地说,这些主题有点过时了我的深度。

所以我的问题是:

  1. 在回归分析非独立观察(例如同一个人的两只眼睛)时,混合效应模型是要走的路吗?我看过使用聚类方差估计的文献。那有什么不同?(我使用 R 作为参考)。

  2. 混合效应模型都是基于回归的。在考虑非独立问题的同时,我将如何进行相当于 t 检验或 mann whitney u 检验?

1个回答
  1. 在回归分析非独立观察(例如同一个人的两只眼睛)时,混合效应模型是要走的路吗?

简而言之:的。

混合模型能够对研究设计在数据中引入的依赖性或结构进行建模。在您测量双眼的示例中,您可以对个体使用具有随机效应的混合模型,因为个体有两只眼睛,因此通过两次出现在数据中而导致依赖性。

但是,您仍然不能将伪复制视为混合模型中的真实复制。在许多情况下,您可以在混合模型中更有效地使用它们,但真正重复的数量并没有通过更改模型类型而神奇地增加。

话虽如此,您所描述的重复测量在医学研究中非常常见,并且可以使用混合模型很好地建模。


  1. 混合效应模型都是基于回归的。在考虑非独立问题的同时,我将如何进行相当于 t 检验或 mann whitney u 检验?

您可以使用(混合)回归模型轻松执行等效的t检验:

library(lme4)
lmer(y ~ x + (1 | rand))

哪里x是一个两水平的因素。第一组x将截距和显着性x作为解释变量意味着两组之间存在显着差异。

至于 Mann-Whitney-U 检验,我不确定您是否可以使用混合模型进行基于等级的检验。但是,您可能不需要,因为您可以使用广义线性混合模型(例如glmer(..., family = 'poisson'))或非线性混合模型(请参阅nlme包)。

尽管该nlme软件包很棒,但我建议您不要太快跳到非线性模型,因为 GLMM 通常更容易解释,并且在许多情况下,临床中数据生成过程的理论分布是一个合乎逻辑的选择研究。


或者,您可以研究贝叶斯层次建模,它实际上与混合模型非常相似,尽管如果您不熟悉贝叶斯统计数据会有点困难。

有许多模型尝试对依赖关系或层次结构进行建模。我不熟悉“集群相关的方差稳健估计”,但具有嵌套结构的混合模型本质上是一个层次模型。