本例中联合概率和条件概率的直观区别

机器算法验证 条件概率 联合分配
2022-03-02 04:01:22

当我遇到这个例子(改写)时,我正在阅读关于边际密度的教程。

一个人正在过马路,我们想根据红绿灯的颜色计算他被过往车辆撞到的概率。

设 H 是人是否被撞, L 是交通灯的颜色。

所以H={hit, not hit}L={red, yellow, green}

假设灯光是红色的,被击中的概率可以写成:显然这是一个条件概率。P(H=hit|L=red)

无论光线如何,被击中的概率都可以写为:正如我最近所理解的那样,这是微不足道的。P(H=hit)

你怎么说:这是一个联合概率。你如何把它翻译成“外行的句子”?它与“被击中的概率和灯是红色的”有什么不同?P(H,L)

感谢您的见解。

4个回答

你实际上有你的答案。

P(H=hit)是边际概率。上面写着“被击中的概率”。这是在过马路时被撞的人的比例,与红绿灯无关。

P(H=hit|L=red)是条件概率。上面写着“假设灯是红色的,你被击中的概率”。它是闯红灯过马路的人群中被撞的比例。

最后,是联合概率。它读取“一个人被汽车撞到并且灯是红色的概率”。它是所有人群中闯红灯的比例。P(H=hit,L=red)

你当然知道这种关系

P(H=hit,L=red)=P(H=hit|L=red)P(L=red)

用“外行的说法”,我们可以这样看。假设闯红灯的概率极小,但是闯红灯的人总是会被撞到。让我们假设您是街边的观察者。你会看到有人被击中,很少会看到灯变红。在所有过马路的人中,他们被红灯撞到的机会非常小,因为他们几乎从来没有这样的机会(很小,因为红灯很少见)。但是,如果你观察的时间足够长,你最终会看到人们被红灯撞到,并且注意到只要红灯亮,过马路的人肯定会被撞到()。P(H=hit,L=red)P(H=hit|L=red)=1

H是随机变量。中取值中取值。在这个例子中,联合分布给出了两种情况同时发生的概率:取特定值取特定值您也可以将其写为要获得特定组合的概率,请插入的值。例如,LH{hit, not hit}L{red, yellow, green}P(H,L)HhLlP(H=h and L=l)hlP(H=hit,L=red)是人被击中并且灯是红色的概率。

您可以认为存在一个总概率(总和为 1),这就像固定数量的“东西”(例如液体)。联合分布采用这一点,并将其以不同的数量分布在的所有可能的值组合中。HL

我试图用假设的联合概率值来解释这个例子:![在此处输入图像描述

这都是关于透视的。想象一个更简单的上下文。假设在一个矩形事件空间中有两个不同的事件 A 和 B。我们可以用绿色和蓝色圆圈为事件空间着色,用红色为重叠区域着色。现在,当我们说 P(A,B) 或 P(A|B) 时,这两者都表示红色区域内的事件。但视角不同。

在 P(A,B) 的情况下,概率是(红色空间的面积)/(整个矩形的面积)

在 P(A|B) 的情况下,概率是(红色空间的面积)/(蓝色圆圈 B 的面积)

在此处输入图像描述 现在,想象一下交通场景。比如说,您正在计算有多少行人正在过马路以及有多少行人被撞到。你的计数如下,

绿、黄、红信号过马路的行人数量 = X, Y, Z

在绿、黄、红信号灯下过马路的行人数量 = A、B、C

现在,P(Hit, Red) = C/(X + Y + Z)

P(命中|红) = (C/(X+Y+Z))/(Z/(X+Y+Z)) = C/Z

因此,当然,在每种情况下,您都必须计算在红色信号中被撞到的行人才能计算 C。当您计算概率 P(Hit, Red) 时,您必须计算所有过马路的行人。但是当您计算概率 P(Hit|Red) 时,您只需计算红灯亮时的人行横道