这个问题是关于我正在审查的一篇论文,所以我不能提供很多细节,但我可以说它涉及聚集在医院的患者和 Cox 比例风险模型。
我对此类数据的直觉是使用多级建模,因为医院可能会在未考虑的方式上有所不同。作者为医院使用了一个具有聚类功能的稳健三明治估计器。
这是一个合理的选择吗?与多级模型相比,它的缺点和优点是什么?
这个问题是关于我正在审查的一篇论文,所以我不能提供很多细节,但我可以说它涉及聚集在医院的患者和 Cox 比例风险模型。
我对此类数据的直觉是使用多级建模,因为医院可能会在未考虑的方式上有所不同。作者为医院使用了一个具有聚类功能的稳健三明治估计器。
这是一个合理的选择吗?与多级模型相比,它的缺点和优点是什么?
我认为,在基于事件发生时间结果分析多中心临床试验时,忽略聚类是通常的做法。也就是说,使用标准的 Cox 模型。在这种情况下,治疗效果具有人口平均(边际)解释,效果在所有中心上取平均值。众所周知,Cox 模型导致了对总体风险比的一致估计(我猜是在一些温和的条件下),但标准误差并不是因为生存时间之间的相关性。但是,可以通过使用折刀来调整标准误差,从而产生某种三明治估计器。该方法可用于R(参见要在其中使用的cluster()函数)coxph())。或者,正如您所建议的,多级建模也可用于此类数据。即中心效应作为随机效应进入 Cox 模型。在生存分析中,这被称为脆弱模型。在脆弱模型中,治疗效果具有特定中心(条件)的解释。该方法也可用于R(参见要在或coxme()中使用的frailty()函数)。 coxph()
两种方法都是正确的,前提是风险比得到很好的解释(人口平均与中心特定)。一般而言,与中心特定效应相比,人口平均效应减弱。我会说选择一种方法而不是另一种方法取决于我们想要对风险比做出的解释。在我看来,特定中心的解释在临床试验的背景下特别相关,因为它比较“同类”。
讨论这个问题的参考文献包括Glidden 和 Vittinghoff(2004 年)、Snavely 的博士论文(第 1 章)以及Duchateau 和 Janssen(2008 年,第 3 章)。