一维风险评分(二元结果)能否合理地用于创建多个治疗组?

机器算法验证 聚类 预言
2022-04-18 01:13:23

这个问题涉及二元结果的预测概率,以及(我相信)沿着一维风险连续体制作多个切点的错误做法——这些切点创建了三个或更多被视为值得不同治疗的组。

我的论点是,使用事件发生的估计风险(例如,感染危险病毒与未感染病毒)将人们分成两个以上的组将是错误的,并且会导致治疗计划效率低下。无论在得分最高的人中减少负面结果的首选治疗方法是什么,该治疗方法都应适用于超过某个临界点的每个人,具体取决于资源。例如,如果我们有资源只处理十分之一,那么我们设置一个分割点以包括十分之一。

我认为,作为一维的风险评分,无法告诉我们在一组多种治疗方案中每个人的最佳选择。如果我们真的想减少感染的发生率,我们会为每个有资源治疗的人提供最好的治疗。

换句话说,我认为使用两个切点来创建三个风险组(高、中、低)是不合逻辑的;给予高组最可靠的治疗;并给予中等群体一些替代治疗。我们能期待什么——对于中等群体,我们可以部分预防感染?(或者如果感染不是最好的例子,想想怀孕或死亡。)他们要么会感染病毒,要么不会感染病毒。如果他们这样做了,在这个例子中,他们将经历同样的后果,就好像他们在被标记为高风险的组中一样。问题是,如何才能以最大的效果应用有限的资源——这再次表明我们对所有得分高于某个单一临界点的人给予单一的最佳治疗。

我的想法合理吗?如果不是,为什么不呢?如果是这样,外行听到的最有说服力的论点是什么?

3个回答

对于外行来说,最有说服力的论点是什么?

不同类型的治疗会带来不同的风险。

这是一个例子:

示例模型:

对于生病的患者:

  • 没有一种治疗的成功率(自发恢复)为 0.01
  • 治疗 A 的成功率为 0.80
  • 治疗 B 的成功率为 0.95

对于健康患者:

  • 治疗 A 可以杀死一个健康患者的概率为 0.01
  • 治疗 B 可以杀死一个健康患者的概率为 0.03

还假设:

  • 我们不能对同一个病人进行两种治疗
  • 风险评分经过校准,因此风险评分 = p(生病)。

我们的目标:

  • 通过给每个患者的风险评分分配治疗,找到一个最大限度地提高预期挽救生命百分比的策略。

优化

  • 风险评分为p的患者在没有治疗的情况下最终健康的概率为

    p*0.01 + (1-p)

  • 风险评分为p的患者在接受治疗 A 后最终健康的概率为

    p*0.8 + (1-p)*0.99

  • 风险评分为p的患者在接受治疗 B 后最终健康的概率为

    p*0.95 + (1-p)*0.97

现在,让我们将这三个概率函数绘制为p的函数:

在此处输入图像描述

很容易看出使用 2 个截止值的基本原理。

每个患者的最佳治疗方法并不相同。

假设您有两种可用的治疗方法: 1. 花费 1000 但有 99% 的机会帮助 2. 花费 10 但有 90% 的工作机会

你宁愿用第一个处理 1,还是用第二个处理 100?

假设您的风险分布是 1、0、...、0,那么您应该只处理第一个。

如果您的风险分布是 0.60,0.599,0.598,0.597,... 那么您可以通过使用第二种药物节省超过 45。

这个模型中有两点你可能忽略了:

  • 不能保证治疗有效
  • 预测几乎不会 100% 正确

假设真正的风险是 1, 0, ..., 0 和以前一样。但是您的方法出错了,产生的风险评分为 0.9, 1.0, 0, ... 0。如果您将所有事情都押在一种治疗上,那么您将治疗错误的人。如果你治疗前 100 名,你有 90% 的成功机会治愈这个玩具示例中真正生病的那个。

假设有三种患者:

  • 风险为0的患者永远不会感染病毒
  • 风险为 1 的患者只有在未经治疗的情况下才会感染病毒
  • 风险为 2 的患者总是会感染病毒

那么最佳策略是使用多个切点并且只治疗风险为 1 的患者。


我通过思考决策树想出了那个病态的例子。我想到的模型是

  • 风险为r的患者到达
  • 如果他们得到治疗,感染的概率是t(r)
  • 如果他们没有得到治疗,感染的概率是u(r)

我最初对每个结果都有成本,但事实证明这些并不重要。重要的是,即使您坚持认为风险是“诚实的”,因为都是递增函数——因此更高的风险会导致更高的感染概率——但这并不意味着治疗的“益处”必须随着风险而增加。rt(r),u(r)t(r)u(r)