贝叶斯定理误用的例子

机器算法验证 贝叶斯
2022-03-16 03:45:28

这个数学溢出社区问题要求提供“涉及数学定理在非数学环境中应用的不良论点的例子”,并产生了一份迷人的病态应用数学列表。

我想知道贝叶斯推理的病理用途的类似例子。有没有人遇到过以古怪的方式使用贝叶斯方法的学术文章、古怪的博客文章。

1个回答

是的。我最近被聘为统计顾问,负责审查一篇特定的(非常糟糕的)文章,该文章的作者使用贝叶斯定理在给编辑的一封信中设法让自己看起来更糟。他们从文章中错误计算的阳性预测值开始(假设 PPV = 95%)。他们基本上无视了 Ricci (2004)的一封批评信,该信试图(但失败)告诉他们应该如何计算它(他建议 82.3%)。然后他们找到了一本生物统计学教科书(Elston & Johnson, 1994)并错误引用了它。我们买了这本书并检查了,但回想起来,这就像我怀疑的那样没有必要。得到这个烂摊子的负载(来自 Barsness 等人给编辑的回复信):

贝叶斯定理1通常指出,特定疾病 (NAT) 的低流行率增强了阳性测试(肋骨骨折)的阳性预测值,以定义疾病状态(NAT 的受害者)......根据贝叶斯定理,1事件的概率由以下等式定义:

P=P(S/D1)P(S/D1)+P(S/D2)
P 是真实事件的概率(NAT 的受害者),P(S/D 1 ) 是阳性测试的概率(肋骨骨折的 PPV 以预测 NAT),P(S/D 2 ) 是后验概率阳性测试(NAT 的流行)。替换我们的数据,肋骨骨折是真实事件的概率[p=95/(95+1.6)]是 98.3%。使用上述 82.3% 的较低 PPV 计算,真实事件的概率为 98.1%。

看到这里有什么奇怪的 连贯了吗?我确定不...

  1. 这是 Elston 和 Johnson (1994)将贝叶斯定理应用于血友病遗传的一个例子:

    P(D1|S)=P(D1)P(S|D1)P(D1)P(S|D1)+P(D2)P(S|D2)

    差异不言自明,但这里引用了他们对该示例的讨论:

    她有一个儿子不受影响这一事实降低了她遗传血友病基因的可能性,从而降低了她的第二个儿子受到影响的可能性。

    我不知道Barsness 和他的同事从哪里得到低流行率会增强PPV 的想法,但他们肯定没有注意他们自己选择的教科书。

  2. 他们似乎不明白 PPV给定肋骨骨折 (S)的“真实事件”(D 1 ) 的概率。因此,在“垃圾进,垃圾出”的诗意完整演示中,他们将自己的 PPV 输入为分子和分母,将流行度添加到分母,得到更高的 PPV。很遗憾他们没有意识到他们可以继续这种循环广告恶心

    p1=95/(95+1.6)=98.3p2=98.3/(98.3+1.6)=98.4
    虽然 98.4 实际上是limkpk(pk1,1.6); 即,如果通过迭代应用它们的方程版本是正确的,则任何 PPV 都可以转换为 98.4,流行度 = 1.6。

  3. 当使用他们的患病率信息以及对该主题的其他研究的敏感性和特异性的一些合理估计时,PPV 结果要低得多(可能低至 3%)。有趣的是,如果他们没有尝试使用贝叶斯定理来加强他们的案例,我什至不会想到使用它。考虑到 1.6% 的流行率,这显然不会奏效。


参考文献
· Barsness, KA, Cha, ES, Bensard, DD, Calkins, CM, Partrick, DA, Karrer, FM, & Strain, JD (2003)。肋骨骨折作为儿童非意外创伤指标的阳性预测价值。创伤、感染和重症监护杂志,54 (6), 1107–1110。
· Elston, RC, & Johnson, WD (1994)。生物统计学要点(第 2 版)。费城:FA 戴维斯公司。
·里奇,LR (2004)。给编辑的信。创伤、感染和重症监护杂志,56 (3), 721。