违反比例 Cox 模型 - 重复分析?

机器算法验证 生存 相互作用 残差 cox模型 冒险
2022-04-04 16:00:43

我是生存分析的新手,但我一直在阅读一些论文和书籍,我得到了一个很好的模型。

但是,其中一个变量 (Sit) 不满足 Cox 模型的比例假设。尽管如此,这让我思考并且它是有道理的,因为该变量应该具有时变效应。例如,在这种情况下,我预计在治疗后不久,某些人的复发风险会更高,而随着时间的推移,所有个体的复发时间都相似。请注意(对我自己),时变效应不同于时变协变量。我花了相当长的时间来完全理解这一点。

现在,我的问题是:

我知道如何包含 Sit 和 time 之间的交互(我正在使用 R)。但是当我添加交互时,一些以前重要的变量不再存在。这让我想到,我应该重复这个过程来选择变量吗?也许,以前删除的一些变量现在很重要。还是应该按原样解释模型,并忽略不再重要的变量?

另一个问题是:

违反了 Cox 模型的比例性。我决定引入互动。那么,现在我不应该进行残差分析吗?由于比例不再是有序的。那我应该如何测试模型的适应度呢?

我对此感到非常困惑,从现在开始,如果能获得一些关于最佳程序的指导和提示,那就太好了。

非常感谢!

1个回答

虽然我不是生存分析方面的专家,但我在这里提出了我的建议,希望它们会有所帮助。

首先,根据 p 值选择变量是错误的方法,尤其是当模型旨在进行统计推断时。您可以在搜索“逐步回归缺点”的多个来源中阅读相关内容。变量的选择应基于您的特定领域知识。所有相关的变量(根据您的意见)都应该存在,无论它们的影响是否显着。通过这种方式,您将报告 Sit 针对已使用变量列表调整的效果,这是正确的。您的研究似乎是探索性的,但不是证实性的。在这种情况下,在解释结果时,您最好强调效应的大小(模型系数、优势比或风险比)而不是 p 值。

至于违反比例假设:考虑到 Sit 与时间之间的相互作用,您将 Sit 对时间的线性依赖性纳入模型。因此,如果 Sit 和 time 之间的真实关系真的接近线性,则将成立比例假设。因此,所有模型诊断方法仍然相关。