我希望有人可以帮助我了解我应该为我的数据使用哪种模型(脆弱、分层或集群)。我有配对数据,因此在对 Cox PH 建模时需要考虑到这一点,并且不确定哪个模型会给我更准确的结果。
我的研究正在研究一个人在受到特定刺激后变得平静所需的时间。每个人在不同的日子受到两种不同的刺激。他们被随机分配哪个刺激是第一个。我已经使用生存分析(事件发生时间)对此进行了建模,但我现在需要考虑数据是配对的。
关于何时使用脆弱、分层或集群模型的任何帮助都会很棒。
我希望有人可以帮助我了解我应该为我的数据使用哪种模型(脆弱、分层或集群)。我有配对数据,因此在对 Cox PH 建模时需要考虑到这一点,并且不确定哪个模型会给我更准确的结果。
我的研究正在研究一个人在受到特定刺激后变得平静所需的时间。每个人在不同的日子受到两种不同的刺激。他们被随机分配哪个刺激是第一个。我已经使用生存分析(事件发生时间)对此进行了建模,但我现在需要考虑数据是配对的。
关于何时使用脆弱、分层或集群模型的任何帮助都会很棒。
该主题由许多论文涵盖,包括:
以下是对两种方法之间差异的非常简短(且非详尽)的总结。
分层方法
对于每一对,都有一个未指定的基线风险函数。通过将特定于每个层的部分可能性相乘,可以很容易地适应部分可能性的想法。
优点:
缺点:
脆弱的方法
对内关联是由来自同一对的两个成员共同的随机效应来解释的。因此,每对再次存在不同的基线危险,但它们并非完全未指定;有一些结构。估计基于边际似然。
优点:
缺点:
coxph()
或parfm()
;在 SAS 中,您可以查看proc phreg
);作为结论,选择取决于您的研究。但是,列表中的最后一个参考给出了一些指导:
对于组大小为 5 或更大的情况,很难证明使用随机效应模型而不是分层模型是合理的,后一种模型更容易实施。对于少于五人的小组,情况会发生变化,特别是对于双胞胎研究,效率提升是如此之大,以至于我们更愿意使用随机效应模型而不是分层模型。分层模型仍然有效,但可能需要多 20% 到 30% 的观测值才能达到相同的精度。