机器算法验证 - 为什么将 p 值称为 P(Data | Hypothesis/Model)？ - 吾爱随笔录

为什么将 p 值称为 P(Data | Hypothesis/Model)？

机器算法验证假设检验 p 值条件概率定义

2022-03-14 10:42:09

正如标题所示，为什么将 p 值称为 P(Data | Hypothesis/Model) 而不是 P(Hypothesis | Data)？两者不应该一样吗？为什么是 P（数据 | 假设）！= P（假设 | 数据）？这里有什么我遗漏的逻辑推理吗？

2个回答

p 值的字面定义是找到至少与观察到的测试统计量一样极端的测试统计量的概率，假设 null 为真：类似于（但不完全相同） $P(\text{Data}\vert\text{Null is true})$ . 如果这样的结果不太可能（低 p 值），我们将其视为反对零假设的证据。反对原假设的足够有力的证据让我们说，“不，如果原假设为真，我们不太可能得到这个结果，但我们确实得到了这个结果，所以原假设看起来是假的”，这是一种矛盾的证明。

您声称根据您收集的数据，p 值可以衡量您的零假设的概率。这是一个常见的错误，但它确实是一个错误。

你提出的等价性代表了一个基本的（并且经常犯的）错误，美国统计协会一段时间以来一直试图消除这个错误。参见Wasserstein、Schirm 和 Lazar (2019)的声明。

您有一个数据集，但有多个相互竞争的假设。人们可能分配给一个给定假设的概率应该反映每个假设相对于竞争对手的证据的相对强度。p 值本身与此完全不同。

当您查看生成低 p 值的假设检验时，p 值代表假设的概率似乎是合理的。但想得更笼统。想象一个假设检验，涉及一个带有一个参数的简单假设。该参数的值是连续的，因此该值位于连续统一体上。有一个 p 值与该连续统一体上无数不同值中的每一个都对应，其中一些 p 值会非常高，非常接近 1.0。连续统一体代表参数值的所有可能性。当我们对一个事件的所有概率求和时，总和应该是 1。但是对所有这些 p 值求和会产生一个比 1 大得多的数字。因此，p 值不是每个不同值的概率参数正确或正确。

其它你可能感兴趣的问题

上一篇概率分布可以有无限的标准差吗？下一篇卷积神经网络尺度敏感性