为了执行 Cox 回归模型的校准(即评估预测结果和观察结果之间的一致性),在预测实际事件中呈现模型准确性的最佳方法是什么?
据我了解,我们可以通过观察在 Cox 模型中具有相似/相同预测概率的多个受试者中发生的事件数量来计算实际结果概率。为了进行上述计算,我们是否将预测风险分为几组(<15%、15-30%、30-45% 等),并且在每个风险组内,我们使用受试者数量作为计算的分母实际结果?
我们使用什么方法来比较预测结果和实际结果?如果我们简单地以表格形式呈现每个风险组中的预测和实际风险百分比是否足够好?R包可以
rms
为你做所有的校准吗?我们可以
pec::predictSurvProb()
用来为每个人提供事件的绝对风险吗?我们能否指定每个人的风险/危害函数处于随访终点的时间点?在解释结果时,我们是否使用平均随访期(以年为单位)作为预测风险和实际风险的时间点?(例如,个体 A 在 6.5 岁时有 30% 的事件风险(平均随访期))
Cox 回归的拟合优度检验(Gronnesby 和 Borgan 检验)是否只是 cox 回归校准的一种方法?还是有别的意思?
为了将模型与净重分类进行比较,我们需要多少个主题和结果才能使这种方法变得有效?
Cox回归生存分析的校准
Cox 模型不能预测结果!“最佳”方法取决于您是否获得风险评分(如 Framingham)或绝对风险(如 Gail Breast Cancer Risk)。你需要准确地告诉我们你适合什么
通过绝对风险预测,您可以根据风险十分位数对组进行分组,并计算观察到的与预期结果频率的比例。这基本上是 Hosmer Lemeshow 测试。但是,为了使用这个测试,你需要有一个绝对的风险预测!例如,您不能按风险评分十分位数划分组并使用经验风险作为风险预测,这会剥离太多信息并导致一些反直觉的结果。
bioconductor 软件包有一套与 ROC 分析、预测曲线等相关的工具。
在 Ulla 的包中没有提到估计平滑的基线危险估计。这是从生存模型中获得风险预测所必需的……因为审查!这是应用该方法的示例。我会从包裹中接受不少。
不,不要使用卑鄙的跟进。您应该报告总人年随访,以及审查率和事件率。Kaplan Meier 曲线向您展示了所有这些。
我敢肯定大卫考克斯爵士不喜欢 G&B 的测试。Cox 模型的强大之处在于它可以提供一致的推理,而不必具有预测准确性:对于许多人来说,这是一个很难掌握的概念。Tsiatis 的书《半参数推理》对此有很多话要说。但是,如果您的目标是让 Cox 模型更进一步并从中创建预测,那么我认为 G&B 测试非常适合此目的。
重新分类指数是比较两个相互竞争的风险预测模型(见 Pencina)被改组到不同(更具区分性)风险类别的个人的比例。重要的是要意识到(Kerr 2011)你可以计算这个值的置信区间......不使用引导程序(或任何将模型视为固定的极限理论),而是使用双引导程序(引导程序样本,改装模型,再次引导程序样本,校准模型)。
@ AdamO 比我知识渊博,但是如果您要做的是查看向模型添加生物标志物是否会改善模型,那么这是“嵌套”模型的情况。需要的是:
- 将零假设定义为 H0:风险预测没有改善
- 应用似然比检验计算对数似然统计 (D) 变化的两倍。
- 这种差异 D 遵循自由度为 n 的卡方分布(如果您仅添加 1 个生物标志物,则在本例中 n=1)。您在卡方表中查找 D 以找到 ap 值。
我玩过评估生物标志物风险对逻辑回归模型的附加值。如果您有兴趣,有一些新的统计指标(包括净重新分类 - 通常应用不佳)以及一种可视化它们的方法,它们比仅仅比较 AUC(c 统计数据)提供的信息要多得多。请参阅我的论文 Pickering, JW 和 Endre, ZH (2012)。评估候选生物标志物诊断潜力的新指标。美国肾脏病学会临床杂志,7, 1355–1364。doi:10.2215/CJN.09590911