在 Cox 模型中使用精确的关系方法有多重要,这需要多长时间?

机器算法验证 r 生存 计算统计 cox模型
2022-04-02 14:51:01

我正在使用 Cox 比例风险模型分析一些模拟工作的结果,我认为数据中有很多联系,代表模拟中的特定个体何时被感染。例如,此模型的(许多)运行之一:

Time, Freq
1, 8
2, 9
3, 5
4, 5
5, 6
6, 4
7, 1
8, 6
9, 4
10, 1
11, 3
12, 2

随后是两三个人的零星关系,一直到时间 = 55。担心关系,我coxph()使用 Breslow 和 Efron 方法分析了数据。

此特定数据的 Breslow 方法的 log(HR) 为 1.95,标准误差为 4.73。Efron 方法产生的 log(HR) 为 1.75,具有相同的标准误差。暂时忽略一般意义上的这些结果的质量,它们略有不同,所以我希望能够使用 Exact 方法进行检查。然而,这似乎是极其计算密集型的,一个约 200 人的小型数据集需要 24 小时以上才能运行。

在此分析中使用准确的方法处理关系有多重要?有人会建议另一种方法吗?参数模型是否会遇到与绑定数据相同的问题?

1个回答

确切的方法需要这么长时间是正常的:它必须做很多事情。我自己的经验是,您所指的近似方法可能很差(即,导致使用精确方法的结论大不相同),但我自己的经验有点不典型,因为它们涉及将这些方法应用于 logit 回归而不是考克斯模型。

如果你为 PHREG 和 Paul D Allison 做一个谷歌,他写了一些关于这个主题的文章,你会找到更多信息。