对于配对数据的 Cox 比例风险,我应该使用哪种模型?

机器算法验证 生存 cox模型 虚弱 配对数据
2022-03-30 12:48:03

我希望有人可以帮助我了解我应该为我的数据使用哪种模型(脆弱、分层或集群)。我有配对数据,因此在对 Cox PH 建模时需要考虑到这一点,并且不确定哪个模型会给我更准确的结果。

我的研究正在研究一个人在受到特定刺激后变得平静所需的时间。每个人在不同的日子受到两种不同的刺激。他们被随机分配哪个刺激是第一个。我已经使用生存分析(事件发生时间)对此进行了建模,但我现在需要考虑数据是配对的。

关于何时使用脆弱、分层或集群模型的任何帮助都会很棒。

1个回答

该主题由许多论文涵盖,包括:

以下是对两种方法之间差异的非常简短(且非详尽)的总结。

分层方法

对于每一对,都有一个未指定的基线风险函数。通过将特定于每个层的部分可能性相乘,可以很容易地适应部分可能性的想法。

优点

  • 缺乏结构。

缺点

  • 它不提供关于对之间异质性的任何信息;
  • 两个成员共享相同协变量信息或仅提供删失观察的配对对可能性没有贡献;这是因为没有尝试进行对间比较。

脆弱的方法

对内关联是由来自同一对的两个成员共同的随机效应来解释的。因此,每对再次存在不同的基线危险,但它们并非完全未指定;有一些结构。估计基于边际似然。

优点

  • 简约性:异质性由单个参数描述;
  • 有关于异质性的总结措施(了解异质性...);
  • 可以研究对中常见变量的影响。

缺点

  • 软件可用性(在 R 中,您可以查看coxph()parfm();在 SAS 中,您可以查看proc phreg);
  • 研究仍在进行中。

作为结论,选择取决于您的研究。但是,列表中的最后一个参考给出了一些指导:

对于组大小为 5 或更大的情况,很难证明使用随机效应模型而不是分层模型是合理的,后一种模型更容易实施。对于少于五人的小组,情况会发生变化,特别是对于双胞胎研究,效率提升是如此之大,以至于我们更愿意使用随机效应模型而不是分层模型。分层模型仍然有效,但可能需要多 20% 到 30% 的观测值才能达到相同的精度。