Cox 比例风险模型可以用于一般左删失数据(即非生存数据)吗?

机器算法验证 审查 比例风险
2022-03-28 12:55:38

应用科学中的一个常见问题是审查数据,特别是由于检测或检测下限 (LOD) 的设备而产生的左审查数据。

假设两者之间存在线性关系xiyi我们可以拟合 Tobit 回归,比如通过survreg()R 中的方法,其中删失数据的“事件时间”设置为 LOD,并且我们指定删失后的观测值是左删失的。这里yi可能是水样中化合物的测量值,该化合物的检出限较低。

我知道 Cox PH 模型经常用于审查数据,但我看到的大多数(如果不是全部)使用它的例子都是在生存或事件发生时间设置中。

Cox PH 是否适合模拟yi有条件的Xi在存在由我上面描述的检测限引起的左删失数据的情况下?

我提出问题的动机是,我感兴趣的几个 R 包包括在familyRglm()函数的参数意义上的 Cox PH 系列,目的是允许 Cox PH 模型适合弹性网络模型(通过glmnet ) 或通过在mgcv中实现的 Wood 等人 (2016) 的一般平滑方法在 GAM 中。

作为一个具体的例子,考虑以下

log(yi)=xi/2+εi

在哪里xiN(μ=1,σ=1.5)εiN(μ=0,σ=1),i1,2,,1000. 因此真正的关系是β0=0βx=0.5. 假设检测水平c=0.5低于此值的值将被删除。

survreg()使用R拟合 Tobit 模型(下面的代码)会产生

> summary(sfit)

Call:
survreg(formula = Surv(ycensored, cens == 1, type = "left") ~ 
    x, data = dat, dist = "loggaussian")
              Value Std. Error       z         p
(Intercept) -0.0176     0.0207  -0.849  3.96e-01
x            0.5076     0.0112  45.193  0.00e+00
Log(scale)  -0.6770     0.0239 -28.355 7.20e-177

Scale= 0.508 

Log Normal distribution
Loglik(model)= -1361.8   Loglik(intercept only)= -1951.2
    Chisq= 1178.79 on 1 degrees of freedom, p= 0 
Number of Newton-Raphson Iterations: 5 
n= 1000

这很好地恢复了参数的真实值。

尝试使用左删失Surv()对象拟合 Cox PH 模型会导致错误,cox.ph()表明 Cox 模型不支持左删失数据,这让我怀疑主要问题的答案是否定的。

  • 如果答案是否定的,有没有办法重新排列或转换数据问题以允许拟合 Cox PH 模型?

    • 如果这是可能的,需要进行哪些重新排列或转换?在解释模型拟合的输出时是否需要采取任何特殊步骤?
  • 如果 Cox PH 模型完全不合适,是否还有其他方法可以对一般左删失数据进行建模,例如所描述的?


R代码

set.seed (237)
nsim <- 1000
x <- rnorm (nsim, 1, 1.5)
y <- exp (x /2 + rnorm (nsim, 0, 0.5))
c <- 0.5
dat <- data.frame(y = y, ycensored = y, x = x, cens = rep(0, nsim))
ind <- y > c
dat$cens[ind] <- 1
    dat$ycensored[!ind] <- c

## Fit the Tobit model
library("survival")
sfit <- survreg(Surv(ycensored, cens == 1, type = "left") ~ x,
                dist = "loggaussian", data = dat)
summary(sfit)

Wood, SN, N. Pya 和 B. Saefken (2015),一般平滑模型的平滑参数和模型选择。http://arxiv.org/abs/1511.03864

1个回答

您可以将 Cox-PH 模型拟合到左删失数据吗?是的。左删失可以是区间删失的子集,您可以使用该函数拟合带有R's icenReg包的 Cox-PH 模型。ic_sp

然而,与其盲目地插入我自己的软件,我会问你是否真的想为你的数据拟合一个 Cox-PH 模型。我不是说你没有,但仅仅知道数据被审查不应该是拟合 Cox-PH 模型的决定性因素。

回想一下,对于审查,我们认为有两个过程:T,真实响应值(表示为T表示传统生存分析案例中的事件时间),由于审查和C,审查过程。Cox-PH 模型描述了两者之间的关系X(协变量)和T,因此我们在决定使用 Cox-PH 模型时需要考虑这种关系。它恰好在计算过程中计算非常方便C导致正确的审查(并且所有的计算便利都通过间隔审查消失了)。

因此,在我们确定 Cox-PH 模型是否合适之前,我们需要考虑T的关系X. 如果您跳出生存分析的世界,就很难解释协变量效应:例如,薪水的“风险比”甚至意味着什么?即使不那么关心解释,您也需要询问效果是否真的合适;做回归关系S(t|X,β)=So(t)exp(XTβ)似乎真的描述了您在数据中看到的内容?

总之:是的,您可以将 Cox-PH 模型拟合到左删失数据。但是你是否应该在很大程度上取决于两者之间的关系XT.