基本辛普森悖论

机器算法验证 自习 混杂 辛普森悖论
2022-01-31 05:46:11

我有一个关于我的统计老师所说的关于以下问题的问题:


你所在的镇上有两家医院,分别名为 Mercy 和 Hope。您必须选择其中一项进行手术。您决定根据他们的手术团队的成功做出决定。幸运的是,根据新的健康计划,医院提供了有关其手术成功率的数据,分为五类手术。假设您获得以下两家医院的数据:

Mercy Hospital
Type         A    B      C    D      E    All
Operations  359  1836   299   2086  149  4729
Successful  292  1449   179   434   13   2366
Hope Hospital 
Type          A   B  C   D   E   All
Operations   88 514 222 86  45   955
Successful   70 391 113 12  2    588

您注意到,在所有类型的操作中,Mercy 的成功率都高于 Hope,但 Hope 的总体成功率最高。您会选择哪家医院以及为什么(选择两个答案)?

A) 怜悯;因为我会去做特定的手术,所以我想要那个手术成功率最高的医院。

B) 希望;由于他们在所有类别中进行的操作较少,因此他们不像 Mercy 那样“乐于操作”。

C) 希望;这是辛普森悖论的一个例子,我们应该始终选择“显而易见”的结论。

D) 怜悯;查看 E 列​​,Mercy 显然做了更困难的手术,因此可能是一家更好的医院。

E) 希望;它具有更好的整体成功率。

F) 怜悯;这是辛普森悖论的一个例子,我们应该始终选择与“显而易见”结论相反的结果。


我的问题甚至不是关于在这种情况下发生辛普森悖论的问题。我的问题只是关于我的教授坚持认为 A) 和 D) 是正确答案而不是 A) 和 F) 的事实。他说,

“由于 E 型手术的成功率非常低,我们可以得出结论,它们很困难,而且不仅不常见。因此,与希望相比,Mercy 可能拥有更好的设备/医生。”

我不明白他怎么能在统计基础上暗示他可以说 Mercy 做了“更困难的手术”。很明显,Mercy 在 E 型手术中的成功率更高,但为什么这意味着他们会做“更难的手术”。我想我被这个问题的措辞搞砸了,教授并没有让步。有人可以解释为什么我错了或者我如何向教授解释这个吗?

3个回答

我认为A和E不是一个好的组合,因为A说你应该选择Mercy,E说你应该选择Hope。

A 和 D 有主张相同选择的美德。但是,让我们更详细地检查 D 中的推理线,因为这似乎是混乱的。手术成功的概率在两家医院遵循相同的顺序,A 型最有可能成功,E 型最不可能成功。如果我们崩溃(即忽略)医院,我们可以看到手术成功的边际概率为:

Type     A     B     C     D     E     All  
Prob   .81   .78   .56   .21   .08     .52

因为 E成功的可能性要小得多,所以可以合理地想象它会更加困难(尽管在现实世界中,也存在其他可能性)。我们也可以将这种思路扩展到其他四种类型。现在让我们看看每家医院每种类型的手术量占多少比例:

Type     A     B     C     D     E  
Mercy  .08   .39   .06   .44   .03  
Hope   .09   .54   .23   .09   .05

我们在这里注意到的是,Hope 倾向于做更多更简单的 AC 手术(尤其是 B 和 C),而像 D.E 这样较难的手术在两家医院都很少见,但是,就其价值而言,Hope 实际上做更高的百分比。尽管如此,辛普森悖论效应将主要由这里的 BD 驱动(实际上不是 E 列作为答案选项 D 建议的)。

辛普森悖论的发生是因为手术难度不同(通常),也因为 N 不同。正是不同类型手术的不同基本费率使得这种做法有悖常理。如果两家医院进行的每种手术数量完全相同,就会很容易看出正在发生的事情。我们可以通过简单地计算成功概率并乘以 100 来做到这一点;这会针对不同的频率进行调整:

Type     A     B     C     D     E     All  
Mercy   81    79    60    21    09     250  
Hope    80    76    51    14    04     225

现在,因为两家医院每次手术都做了 100 次(总共 500 次),所以答案很明显:Mercy 是更好的医院。

没有一个答案是完全没有根据的。但是它们都假设有大量的外部知识,并且不能严格根据统计数据被认为是正确的。

A、B、D 和 E 都需要对导致患者选择一所医院而不是另一家医院的因素进行假设;医生和患者匹配的过程,成功率归因于特定手术类别与 ICU 等共享因素的程度,等等。

在现实世界中,我们可以合理地考虑许多替代因素,例如医院正式接受的支付提供商、社区的社会经济学和肥胖率,这是否是教学医院(在这种情况下,当新实习生到来时,成功率会直线下降,我们必须考虑每月组合),等等。

显然,我们可以并且确实对这些因素做出合理的假设,但如果没有具体解决或将它们排除在问题之外,就不可能说答案是否“正确”。

@gung 给出了一个非常彻底的答案,但 D 是该问题的正确答案还有一个原因:更好的医院会做更多困难的手术,因为它们更好。也就是说,如果一个人进入希望医院进行手术 E(最难),他们可能会将他/她送到 Mercy,因为他们在希望医院不知道该怎么做。

这甚至发生在现实世界中,最困难的病例被送到更大或更专业的医院。