贝叶斯定理直觉

机器算法验证 贝叶斯 可能性 直觉
2022-02-07 04:32:15

我一直在尝试根据先验后验似然边际概率对贝叶斯定理建立基于直觉的理解。为此,我使用以下等式: 其中代表假设或信念,代表数据或证据。 我已经理解了后验的概念——它是一个结合了先验信念和事件可能性的统一实体我不明白的是可能性意味着什么?为什么是边缘

P(B|A)=P(A|B)P(B)P(A)
AB
分母中的概率?
在查看了一些资源后,我发现了这句话:

可能性的发生给出的事件的权重...的后验概率,假设事件已经发生。BAP(B|A)BA

以上2个陈述对我来说似乎相同,只是写法不同。谁能解释一下两者的区别?

4个回答

虽然在贝叶斯定律中列出了四个组件,但我更喜欢从三个概念组件的角度来考虑:

P(B|A)2=P(A|B)P(A)3P(B)1

  1. 先验是您在遇到新的相关信息(即 )之前的看法B A
  2. 后验是您在遇到新的相关信息 的信念(或应该,如果您是理性的)。B
  3. 似然比除以新信息的边际概率的商表明新信息对于您对的信念的信息量B

已经有几个很好的答案,但也许这可以增加一些新的东西......

我总是从分量概率的角度来考虑贝叶斯规则,这可以用如下图所示AB

事件集

边际概率 由相应圆圈的面积给出所有可能的结果由表示,对应于事件集“ ”。联合概率对应于事件“ ”。P(A)P(B)P(AB)=1AB P(AB)AB

在这个框架中,贝叶斯定理中的条件概率可以理解为面积的比率。给定的概率占据的分数,表示为 类似地,概率给定占据的的分数,即 ABBAB

P(A|B)=P(AB)P(B)
BAAAB
P(B|A)=P(AB)P(A)

贝叶斯定理实际上只是上述定义的数学推论,可以重述为 I发现贝叶斯定理的这种对称形式更容易记住。也就是说,无论哪个被标记为“先验”还是“后验”,恒等式都成立。

P(B|A)P(A)=P(AB)=P(A|B)P(B)
p(A)p(B)

(从更“会计电子表格”的角度来看,我对这个问题的回答中给出了另一种理解上述讨论的方式。)

@gung 有一个很好的答案。我将添加一个示例来解释现实世界示例中的“启动”。

为了更好地与现实世界的例子联系起来,我想更改符号,其中使用表示假设(方程中的),并使用表示证据。等式中HAEB

所以公式是

P(H|E)=P(E|H)P(H)P(E)

注意同样的公式可以写成

P(H|E)P(E|H)P(H)

其中表示成比例似然性,先验这个等式意味着如果等式的右侧更大,则后验会更大。你可以认为是一个归一化常数,使数字变成概率(我说它是常数的原因是因为证据已经给出。)。P(E|H)P(H)P(E)E

对于现实世界的示例,假设我们正在对信用卡交易进行一些欺诈检测。那么假设将是,其中表示交易是正常的或欺诈的。(我选择了极端不平衡的情况来展示直觉)。H{0,1}

根据领域知识,我们知道大多数交易都是正常的,只有极少数是欺诈行为。专家告诉我们是欺诈。所以我们可以说先验11000P(H=1)=0.001P(H=0)=0.999

最终目标是计算,这意味着我们想知道交易是否是欺诈,而不是基于除先验之外的证据如果您查看等式的右侧,我们将其分解为似然性和先验性。P(H|E)

我们已经解释了什么是先验,这里我们解释什么是可能性。假设我们有两种类型的证据,表示,如果我们看到交易的正常或奇怪的地理位置。E{0,1}

的可能性可能很小,这意味着给定正常的交易,该位置不太可能是奇怪的。另一方面,可以很大。P(E=1|H=0)P(E=1|H=1)

假设,我们观察到,我们想看看它是否是欺诈,我们需要同时考虑先验和可能性直觉上,从之前的情况来看,我们知道欺诈交易很少,除非证据非常有力,否则我们可能会非常保守地进行欺诈分类。因此,两者之间的产品会同时考虑两个因素。E=1

2015 年 8 月 7 日中篇文章用许多图片解释!十分之一的人生病了。

在此处输入图像描述

为了简化这个例子,我们假设我们知道哪些是生病的,哪些是健康的,但是在真实的测试中你不知道这些信息。现在我们测试每个人的疾病:

在此处输入图像描述

真阳性 = 患病人群中阳性结果的数量 = #(Positive | Sick) = 9。

现在有趣的问题是,如果检测呈阳性,生病的概率是多少?在数学中,Pr(Sick|Positive)?

在此处输入图像描述