条件概率公式背后的直觉是什么?

机器算法验证 可能性 条件概率 直觉
2022-02-08 16:08:05

鉴于已经发生发生的条件概率公式为AB

P(A | B)=P(AB)P(B).

我的教科书用维恩图解释了这背后的直觉。

在此处输入图像描述

鉴于发生的唯一方法是事件落入的交集。BAAB

在那种情况下,的概率不会简单地等于交集的概率,因为这是事件发生的唯一方式吗?我错过了什么?P(A|B)AB

4个回答

一个很好的直觉是,我们现在处于 B 出现的宇宙中,即整个圆圈。在那个圆圈中,A 也是多少?

Marc Herman 在课堂上提供了这种直观的解释

https://people.math.rochester.edu/faculty/herman/

我会这样想:我理所当然地认为你理解直觉,直到:

鉴于 B 已经发生,A 发生的唯一方法是让偶数落在 A 和 B 的交点处。

我要评论你发布的第二张图片:

  1. 想象整个白色矩形是您的样本空间Ω

    将概率分配给一组意味着您在某种意义上正在测量该组。这与您测量矩形的面积相同,但概率是具有特定属性的不同类型的度量(我不会对此多说)。

  2. 您知道,它的解释如下:P(Ω)=1

    Ω代表所有可能发生的事件和必须发生的事情,因此我们有 100% 的概率发生某事。

  3. 类似地,集合的概率与样本空间的概率成正比从图形上讲,您看到的度量(其概率)必须小于同样的推理对集合是有效的。这个集合是可以测量的,它的度量是AP(A)ΩAΩAP(A)P(Ω)ABP(AB)

  4. 如果现在你被告知已经发生,你必须认为B你的“新”如果是你的“新”那么你可以 100% 确定一切都发生在集合中。BBΩBΩB

    那是什么意思?这意味着现在,在“新”竞赛中,您必须重新调整所有概率度量,考虑到它们必须用“新”样本空间表示. 这是一个简单的比例。P(BB)=1B

    当您这么说时,您的直觉几乎是正确的:

P(A | B) 的概率将简单地等于 A 相交 B 的概率

并且“几乎”是由于现在您的样本空间已经改变(现在是)并且您想要相应地重新调整BP(AB)

  1. P(AB)是您的新世界中的换句话说,您会这样说(并请尝试在带有集合的图像上将其可视化):P(AB)B

    在新世界中,的度量与的度量之比必须与的度量与BABΩAB

  2. 最后用数学语言翻译这个(简单的比例):

P(B):P(AB)=P(Ω):P(AB)

并且由于 ,因此得出:P(Ω)=1

P(AB)=P(AB):P(B)

你会很容易地看到直觉思考以下问题。

假设您有 10 个球:6 个黑色和 4 个红色。黑球中有 3 个很棒,而红球中只有 1 个很棒。黑球也很棒的可能性有多大?

答案很简单:50%,因为在总共 6 个黑球中,我们有 3 个 Awesome Black 球。

这就是您如何将概率映射到我们的问题:

  • 3 个黑球 AND Awesome 对应于P(AB)
  • 6个黑球对应P(B)
  • 当我们知道它是黑球时,它是真棒的概率:P(AB)

对于条件概率公式的基本直觉,我总是喜欢使用双向表。假设一个年级有 150 名学生,其中 80 名女性和 70 名男性,每个人必须学习一门语言课程。学习不同课程的学生的双向表是:

        | French   German   Italian  | Total
-------- --------------------------- -------
Male    |     30       20        20  |    70
Female  |     25       15        40  |    80
-------- --------------------------- -------
Total   |     55       35        60  |   150

假设一个学生上意大利语课程,他们是女性的概率是多少?那么意大利语课程有60名学生,其中40名是学习意大利语的女性,所以概率必须是:

P(F|Italian)=n(FItalian)n(Italian)=4060=23

其中集合的基数,即它包含的项目数。请注意,我们需要在分子中使用而不仅仅是,因为后者将包括所有 80 名女性,包括其他 40不学习意大利语的人。n(A)An(FItalian)n(F)

但是,如果问题反过来,考虑到学生是女性,他们参加意大利语课程的概率是多少?然后 80 名女学生中有 40 名参加了意大利语课程,所以我们有:

P(Italian|F)=n(ItalianF)n(F)=4080=12

我希望这可以直观地解释为什么

P(A|B)=n(AB)n(B)

理解为什么分数可以写成概率而不是基数是等价分数的问题。例如,让我们回到学生是女性的概率,因为他们正在学习意大利语。总共有 150 名学生,所以一个学生是女性并且学习意大利语的概率是 40/150(这是一个“联合”概率),一个学生学习意大利语的概率是 60/150(这是一个“边际”概率)。请注意,将联合概率除以边际概率得出:

P(FItalian)P(Italian)=40/15060/150=4060=n(FItalian)n(Italian)=P(F|Italian)

(要看到分数是等价的,将分子和分母乘以 150 会删除每个分数中的“/150”。)

更一般地说,如果你的采样空间有基数 ——在这个例子中,基数是 150——我们发现Ωn(Ω)

P(A|B)=n(AB)n(B)=n(AB)/n(Ω)n(B)/n(Ω)=P(AB)P(B)