当一个事件是另一个事件的子集时添加两个事件的概率

机器算法验证 可能性
2022-03-17 16:19:16

我正在尝试对明年发生的事件做出一些预测,但我对我正在使用的方法有疑问。

这是我正在处理的问题的一个程式化示例:

爱丽丝和鲍勃第一次跑马拉松。我对估计 p(Alice 或 Bob 完成比赛)和 p(Alice 和 Bob 完成比赛)以及 p(Alice 完成比赛)和 p(Bob 完成比赛)感兴趣。

我收集了一些关于 Alice 和 Bob 的体能、训练计划和首次参赛者完成马拉松的基本比率的信息。经过这项研究,我相信 p(Alice 或 Bob 完成比赛) = 0.75,并且 p(Alice 和 Bob 完成比赛) = 0.35

为了计算出 p(Alice 完成比赛)和 p(Bob 完成比赛),我正在考虑将我已经做出的两个概率估计相加,然后将两者之间的总概率分开(基于我的信息有关于他们)。所以这看起来像:0.75 + 0.35 = 1.10,分成 p(Alice) = 0.8 和 p(Bob) = 0.3

但是,鉴于第二个事件是第一个事件的子集,我不确定将 p(Alice 或 Bob) 和 p(Alice 和 Bob) 相加是否合适。这是进行预测的合适方法吗?

是否有另一种方法可以使用我掌握的关于 p(Alice 和 Bob)、p(Alice 或 Bob) 及其背景的信息来预测 p(Alice) 和 p(Bob)?

1个回答

包含-排除原理表明 因此,你知道 如果没有进一步的信息/假设,就不可能唯一标识P(AB)=P(A)+P(B)P(AB).P(AB)+P(AB)=P(A)+P(B).P(A)P(B).

您在标题中使用了“条件”一词,但重要的是要注意这不是包含条件概率的问题。条件概率的形式是“在 Bob 完成的情况下 Alice 完成的概率是多少?” 它的符号是使用它的技术是贝叶斯规则,它只是一种特别突出的条件概率关系。P(A|B),

Gung 的评论指出了使用条件概率识别例如,如果我们知道,我们可以使用贝叶斯规则 并且我们可以求解使用代数。P(A)P(B)P(B|A)

P(B|A)=P(AB)P(A)
P(A)

你评论说你正在假设独立。独立性被定义为意味着因为我们知道并且所以解set 是满足以下条件的点的集合:P(AB)=P(A)P(B).P(A)+P(B)=P(AB)+P(AB)P(AB)=P(A)P(B),

  1. P(A)[0,1]
  2. P(B)[0,1]
  3. P(B)P(A)=P(AB)
  4. P(A)+P(B)=P(AB)+P(AB)

解决此问题的一个明显方法是将 (3) 和 (4) 中的线绘制为的函数。十字路口就是答案。P(A)P(B)

关于独立性的一个警告:假设独立性是一个非常强的假设。当违反独立性假设时,结果通常不是“稍微错误”而是大错特错