我正在使用 R 中进行 Cox 比例风险回归coxph
,其中包含许多变量。Martingale 残差看起来很棒,而 Schoenfeld 残差对于几乎所有变量都很好。有三个变量的 Schoenfeld 残差不是平坦的,并且变量的性质使得它们可以随时间变化是有意义的。
这些是我并不真正感兴趣的变量,因此将它们设为分层就可以了。但是,它们都是连续变量,而不是分类变量。所以我认为地层不是一条可行的路线*。我已经尝试在变量和时间之间建立交互,如此处所述,但我们得到了错误:
In fitter(X, Y, strats, offset, init, control, weights = weights, :
Ran out of iterations and did not converge
我正在处理近 1000 个数据点,并且正在处理六个变量,每个变量都有很多因素,所以感觉就像我们正在推动如何对这些数据进行切片和切块的限制。不幸的是,我用更少的包含变量尝试过的所有更简单的模型显然更糟(例如,Schoenfeld 残差对于更多变量来说更脆弱)。
我有哪些选择?由于我不关心这些特别糟糕的变量,我想忽略它们的输出,但我怀疑这不是一个有效的解释!
*一个是连续的,一个是范围超过100的整数,一个是范围为6的整数。也许分箱?