我有一个关于我的统计老师所说的关于以下问题的问题:
你所在的镇上有两家医院,分别名为 Mercy 和 Hope。您必须选择其中一项进行手术。您决定根据他们的手术团队的成功做出决定。幸运的是,根据新的健康计划,医院提供了有关其手术成功率的数据,分为五类手术。假设您获得以下两家医院的数据:
Mercy Hospital
Type A B C D E All
Operations 359 1836 299 2086 149 4729
Successful 292 1449 179 434 13 2366
Hope Hospital
Type A B C D E All
Operations 88 514 222 86 45 955
Successful 70 391 113 12 2 588
您注意到,在所有类型的操作中,Mercy 的成功率都高于 Hope,但 Hope 的总体成功率最高。您会选择哪家医院以及为什么(选择两个答案)?
A) 怜悯;因为我会去做特定的手术,所以我想要那个手术成功率最高的医院。
B) 希望;由于他们在所有类别中进行的操作较少,因此他们不像 Mercy 那样“乐于操作”。
C) 希望;这是辛普森悖论的一个例子,我们应该始终选择“显而易见”的结论。
D) 怜悯;查看 E 列,Mercy 显然做了更困难的手术,因此可能是一家更好的医院。
E) 希望;它具有更好的整体成功率。
F) 怜悯;这是辛普森悖论的一个例子,我们应该始终选择与“显而易见”结论相反的结果。
我的问题甚至不是关于在这种情况下发生辛普森悖论的问题。我的问题只是关于我的教授坚持认为 A) 和 D) 是正确答案而不是 A) 和 F) 的事实。他说,
“由于 E 型手术的成功率非常低,我们可以得出结论,它们很困难,而且不仅不常见。因此,与希望相比,Mercy 可能拥有更好的设备/医生。”
我不明白他怎么能在统计基础上暗示他可以说 Mercy 做了“更困难的手术”。很明显,Mercy 在 E 型手术中的成功率更高,但为什么这意味着他们会做“更难的手术”。我想我被这个问题的措辞搞砸了,教授并没有让步。有人可以解释为什么我错了或者我如何向教授解释这个吗?