辛普森的“悖论”是一个众所周知的现象,对于初学者来说可能是违反直觉的:比如说,一项医学试验可能表明某种治疗对男性群体和女性群体都有益,但是总体上对人体有害。
我的第一个问题是:在这种情况下,从业者怎么办?医生是否会向患者推荐上述治疗方法?还是辛普森现象本身表明样本量/显着性水平不足,从而使试验没有结论?
最后,有人研究过辛普森现象的定量版本吗?
辛普森的“悖论”是一个众所周知的现象,对于初学者来说可能是违反直觉的:比如说,一项医学试验可能表明某种治疗对男性群体和女性群体都有益,但是总体上对人体有害。
我的第一个问题是:在这种情况下,从业者怎么办?医生是否会向患者推荐上述治疗方法?还是辛普森现象本身表明样本量/显着性水平不足,从而使试验没有结论?
最后,有人研究过辛普森现象的定量版本吗?
对于所有患者描述符都在因果图的正确部分的情况,一个必要但非充分条件是描述符在“零时间”或更早被评估,辛普森的“悖论”只不过是失败问一个足够具体的问题。远离边际治疗效果,而是以与因果途径一致的所有可用信息为条件。在年龄和性别的情况下,很少不适合以它们为条件。治疗效果应该是有条件的并尊重信息流。专注于为一名正在接受治疗的患者做出最佳治疗决策。
“在这种情况下,修炼者怎么办?” 关键是要理解为什么在特定情况下会出现辛普森悖论。这取决于情况。让我们想象一个医学试验示例,其中有男性和女性,治疗和安慰剂,“改善”或“没有改善/伤害”。可能是女性通常更有可能表现出改善,并且出于某种原因,女性接受了很多安慰剂和很少的治疗。在这种情况下,安慰剂可能看起来不如男性和女性的治疗,但在聚合后会更好。现在非常重要的是,为什么安慰剂组中的女性相对较多。如果这是一项随机试验,只是因为分配的随机变化,而男性和女性之间的差异是有意义的,当然,应该单独查看男性和女性的结果(因为聚合差异没有意义,而男性/女性差异是)。然而,人们也可以想象这样一种情况,实际上出于伦理原因(在临床试验中可能不是一件有效的事情,但无论如何)有一些严重的病例,并决定对这些病例进行治疗,而且几乎所有这些都是男性,在非严重病例中,男女之间没有有意义的差异。然后不能说治疗对男性和女性都更好,因此总体上更好(尽管是总数)-但是,人们需要考虑严重程度,也不能仅通过查看总数来得出结论(因为再一次本质上不同的事物是聚合在一起的)。
无论如何,基线是需要从背景信息中解释辛普森悖论的发生,而要做什么则关键取决于该解释。
“或者,辛普森现象本身是否表明样本量/显着性水平不足,从而使试验无法得出结论?” 不,原则上它可以在任何样本量下发生,增加它不一定会让它消失。一个例外是,如果它发生在随机试验中,由于异常随机数引起的组不平衡 - 这可能会通过更大的样本来平衡(再次重要的是要了解导致它的原因)。
tl;dr – 辛普森悖论没有问题,除非相关性被不恰当地假定为因果关系。
让我们假设这些前提:
医疗保健可以帮助明显健康的人。
医疗保健可以帮助明显不健康的人。
接受医疗保健的人更有可能明显不健康。
在这里,我们遇到了辛普森悖论的机会:尽管两个亚群中的每一个都具有正相关,但大部分人群的表观健康和接受医疗保健之间存在负相关。
但这并不是真正的矛盾(令人困惑),对吧?我的意思是,显然,负面关联是由于人们在明显不健康时寻求医疗护理。
缺少的部分是假设因果关系。例如,如果有人研究了表观健康和接受医疗保健之间的相关性,然后假设它是因果关系,那么他们会感觉到一种自相矛盾的情况:
医疗保健帮助健康的人。
医疗保健帮助不健康的人。
医疗保健会伤害(健康或不健康)人。
没有错误的因果假设,辛普森悖论不是一个悖论。
当您发现意识到有人在此过程中搞砸了。
需要明确的是,合理的分析可以找到总人口与其组成子人口具有不同相关性的相关性,例如上面的示例。但是合法的分析不应该能够得出因果行为被逆转的情况。