比较 Cox 比例风险模型 - AIC?

机器算法验证 r 模型 生存
2022-04-01 00:28:35

我有一些非常经验的数据来自肺癌放射图像的纹理分析。作为后处理的结果,有两个几乎相同的数据集,每个数据集包含 53 个病例,不同之处仅在于它们如何描绘/分割肿瘤。一种描绘方法称为“徒手”,另一种称为“flab”。

我根据纹理变量“熵”对 53 个病例的生存情况进行了建模。获得了两个单变量 cox 比例风险模型,一个用于手动描绘,一个用于松弛。但我发现很难决定哪种型号更好。在这篇文章中如何解释和比较 Cox 回归中的模型?,有人建议使用 AIC,所以我将其输出包括在内。我想知道这两个模型是否等效(是否有比较两个模型的 AIC 的 p 检验?)如果是,我想听听应该报告哪些统计措施来支持这一主张。

谢谢。

使用 R,以下是每个模型的输出:

FLAB模型

Call:
coxph(formula = y ~ entropyflab)

  n= 53, number of events= 34 

                coef exp(coef) se(coef)      z Pr(>|z|)  
entropyflab -0.15838   0.85353  0.06505 -2.435   0.0149 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

            exp(coef) exp(-coef) lower .95 upper .95
entropyflab    0.8535      1.172    0.7514    0.9696

Concordance= 0.609  (se = 0.056 )
Rsquare= 0.089   (max possible= 0.984 )
Likelihood ratio test= 4.93  on 1 df,   p=0.02635
Wald test            = 5.93  on 1 df,   p=0.01491
Score (logrank) test = 6.1  on 1 df,   p=0.01355

FLAB AIC: 215.9091

自由手考克斯模型:

coxph(formula = y ~ entropyfh)

  n= 53, number of events= 34 

             coef exp(coef) se(coef)      z Pr(>|z|)  
entropyfh -0.1792    0.8359   0.0761 -2.355   0.0185 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

          exp(coef) exp(-coef) lower .95 upper .95
entropyfh    0.8359      1.196    0.7201    0.9704

Concordance= 0.655  (se = 0.056 )
Rsquare= 0.085   (max possible= 0.984 )
Likelihood ratio test= 4.72  on 1 df,   p=0.02975
Wald test            = 5.55  on 1 df,   p=0.01852
Score (logrank) test = 5.76  on 1 df,   p=0.01644

Freehand AIC: 216.1183

3个回答

对于 Cox 比例风险模型,未估计基线风险(即“截距”),因此可能性只是部分可能性。即使这是部分的,也可以使用似然比检验 (LRT)比较嵌套COX 模型,以测试模型拟合的显着差异。

Akaike 的信息准则 (AIC) 也取决于可能性,还取决于模型使用的预测变量/参数/自由度的数量。定义如下 AIC=2k2ln(L) 其中 k = 使用的 df 数量,L 是模型的(部分)可能性。较低的 AIC 对应于更好的拟合。

AIC 通常与 LRT 一致,但由于对添加到模型中的每个参数/df 进行了严格校正,因此有时会得出不同的结论。

但是,在您的情况下,模型不是嵌套的。据我所知,没有(简单的)统计测试来比较这些模型的数据拟合(如果是这样,我也想学习!)。AIC 对此有点例外,因为它对参数数量的校正使得在相同数据上为相同结果生成的非嵌套模型更具可比性。

所以总而言之,不,没有简单的方法可以使用统计测试来比较特定的 AIC。所以恕我直言,具有最低 AIC 的模型将是最好的,无论显着性检验如何。

作为对进一步思考和更聪明的人的建议:是否可以引导数据,在每个引导数据集中构建两个模型,然后比较 AIC 的分布是统计测试这两个 AIC 的一种方法?

我认为您的问题是模型选择之一。

如果您考虑前向选择,并在包含一个变量后停止,那么您最终会得到FLAB模型。与其他单变量模型相比,它更显着,AIC 更小。从输出来看,没有理由不选择这个模型。

这两个 AIC 告诉您模型在拟合优度方面大致相同。但是你不能严格比较模型,因为它们不是嵌套的(就像 IWS 说的那样)。

我认为您还应该同时使用FLAB和来拟合模型Freehand然后,您将能够查看嵌套在多变量模型中的单变量模型,并使用似然比检验或类似的东西来评估模型FLAB + Freehand是否优于FLAB仅模型。

由于其他一切都非常相似,c-index(模型摘要中的一致性)值不同,因此可用于比较模型。基于此,手绘模型更好(0.655 vs. 0.609)。