在 ROC 曲线分析中调整协变量

机器算法验证 流行病学
2022-02-07 00:17:30

这个问题是关于在存在相关量表的情况下估计多维筛选问卷的截止分数以预测二元终点。

我被问及在设计可能用于酒精中毒筛查的测量量表(人格特征)的每个维度的截止分数时控制相关子分数的兴趣。也就是说,在这种特殊情况下,该人对调整外部协变量(预测变量)不感兴趣——这会导致协变量调整的 ROC 曲线下的(部分)面积,例如(1-2)——但主要是其他分数来自同一份问卷,因为它们相互关联(例如“冲动”与“寻求感觉”)。它相当于构建一个 GLM,其中包括左侧的感兴趣分数(我们寻求截止)和从同一问卷计算的另一个分数,而右侧的结果可能是饮酒状态。

为了澄清(根据@robin 请求),假设我们有j=4分数,说xj(例如,焦虑、冲动、神经质、寻求感觉),我们想要找到一个临界值tj(即“正面案例”如果xj>tj, 否则为“否定情况”)对它们中的每一个。在设计此类截止值时(使用 ROC 曲线分析),我们通常会调整其他风险因素,例如性别或年龄。现在,既然已知 SS 与 IMP 相关,那么如何调整性别、年龄和感觉寻求 (SS) 的冲动性 (IMP)?换句话说,我们将有一个 IMP 的截止值,其中年龄、性别和焦虑水平的影响被消除。

除了说截止必须尽可能简单之外,我的回答是

关于协变量,我建议在调整和不调整的情况下估计 AUC,以查看预测性能是否提高。在这里,您的协变量只是从同一测量工具定义的其他子分数,我从未遇到过这种情况(通常,我会根据已知的风险因素进行调整,如年龄或性别)。[...] 此外,由于您对预后问题(即问卷的筛查效果)感兴趣,您可能还对估计提供的阳性预测值(PPV,阳性检测结果被正确分类的患者的概率)感兴趣您可以根据问卷中的子分数将主题分类为“正面”或“负面”。但是请注意,

您是否对这种特殊情况有更透彻的了解,并尽可能提供相关论文的链接?

参考

  1. Janes, H 和 Pepe, MS (2008)。调整诊断、筛查或预后标志物研究中的协变量:新环境中的旧概念美国流行病学杂志,168(1):89-97。
  2. Janes, H 和 Pepe, MS (2008)。在 ROC 分析中容纳协变量华盛顿大学生物统计学工作论文系列,论文 322。
2个回答

您设想的分析方式实际上并不是我建议您开始考虑它的方式。首先很容易证明,如果必须使用截止值,那么截止值不是应用于单个特征,而是应用于整体预测概率。单个协变量的最佳截止值取决于其他协变量的所有水平;它不可能是恒定的。其次,ROC 曲线在满足为单个受试者做出最佳决策的目标方面没有任何作用。

为了处理相关尺度,有许多数据缩减技术可以提供帮助。其中之一是正式的冗余分析,其中每个预测器依次从所有其他预测器非线性预测。这是在redunRHmisc包中的函数中实现的。变量聚类、主成分分析和因子分析是其他可能性。但在我看来,分析的主要部分应该是建立一个好的概率模型(例如,二元逻辑模型)。

Janes, Pepe 关于协变量调整 ROC 曲线的文章的要点是允许对估计的 ROC 曲线值进行更灵活的解释。这是一种在感兴趣的人群中对特定群体的 ROC 曲线进行分层的方法。估计的真阳性分数(TPF;等式敏感性)和真阴性分数(TNF;等式特异性)被解释为“在疾病状态为 Y/N 的相同 [调整变量列表]”。乍一看,听起来您想要做的是通过在您的面板中加入更多标记来改进您的诊断测试。

更好地理解这些方法的一个很好的背景是阅读 Cox 比例风险模型并查看 Pepe 关于“分类和......的医学测试的统计评估”的书。您会注意到筛选可靠性度量与生存曲线具有许多相似的属性,将拟合分数视为生存时间。正如 Cox 模型允许对生存曲线进行分层一样,他们建议提供分层的可靠性度量。

这对我们很重要的原因可能在二元混合效应模型的背景下是合理的:假设您有兴趣预测成为冰毒成瘾者的风险。SES 在这方面具有如此明显的主导作用,以至于评估可能基于个人行为而不以某种方式分层的诊断测试似乎是愚蠢的。这是因为[随心所欲],即使有钱人表现出躁狂和抑郁症状,他们也可能永远不会尝试使用冰毒。然而,一个穷人会表现出更大的风险增加有这种心理症状(和更高的风险评分)。对风险的粗略分析将显示您的预测模型的性能非常差,因为两组的相同差异不可靠。然而,如果你分层(富人和穷人),

协变量调整的重点是考虑不同组的同质性,因为不同层之间的风险模型中的患病率和交互作用较低。