我一直在尝试根据先验、后验、似然和边际概率对贝叶斯定理建立基于直觉的理解。为此,我使用以下等式: 其中代表假设或信念,代表数据或证据。 我已经理解了后验的概念——它是一个结合了先验信念和事件可能性的统一实体。我不明白的是可能性意味着什么?为什么是边缘
分母中的概率?
在查看了一些资源后,我发现了这句话:
可能性的发生给出的事件的权重...是的后验概率,假设事件已经发生。
以上2个陈述对我来说似乎相同,只是写法不同。谁能解释一下两者的区别?
我一直在尝试根据先验、后验、似然和边际概率对贝叶斯定理建立基于直觉的理解。为此,我使用以下等式: 其中代表假设或信念,代表数据或证据。 我已经理解了后验的概念——它是一个结合了先验信念和事件可能性的统一实体。我不明白的是可能性意味着什么?为什么是边缘
可能性的发生给出的事件的权重...是的后验概率,假设事件已经发生。
以上2个陈述对我来说似乎相同,只是写法不同。谁能解释一下两者的区别?
虽然在贝叶斯定律中列出了四个组件,但我更喜欢从三个概念组件的角度来考虑:
已经有几个很好的答案,但也许这可以增加一些新的东西......
我总是从分量概率的角度来考虑贝叶斯规则,这可以用如下图所示和
边际概率 和由相应圆圈的面积给出。所有可能的结果由表示,对应于事件集“或 ”。联合概率对应于事件“和 ”。
在这个框架中,贝叶斯定理中的条件概率可以理解为面积的比率。给定的概率占据的分数,表示为 类似地,概率给定占据的的分数,即
贝叶斯定理实际上只是上述定义的数学推论,可以重述为 I发现贝叶斯定理的这种对称形式更容易记住。也就是说,无论哪个或被标记为“先验”还是“后验”,恒等式都成立。
(从更“会计电子表格”的角度来看,我对这个问题的回答中给出了另一种理解上述讨论的方式。)
@gung 有一个很好的答案。我将添加一个示例来解释现实世界示例中的“启动”。
为了更好地与现实世界的例子联系起来,我想更改符号,其中使用表示假设(方程中的),并使用表示证据。(等式中
所以公式是
注意同样的公式可以写成
其中表示成比例,是似然性,是先验。这个等式意味着如果等式的右侧更大,则后验会更大。你可以认为是一个归一化常数,使数字变成概率(我说它是常数的原因是因为证据已经给出。)。
对于现实世界的示例,假设我们正在对信用卡交易进行一些欺诈检测。那么假设将是,其中表示交易是正常的或欺诈的。(我选择了极端不平衡的情况来展示直觉)。
根据领域知识,我们知道大多数交易都是正常的,只有极少数是欺诈行为。专家告诉我们,是欺诈。所以我们可以说先验是和。
最终目标是计算,这意味着我们想知道交易是否是欺诈,而不是基于除先验之外的证据。如果您查看等式的右侧,我们将其分解为似然性和先验性。
我们已经解释了什么是先验,这里我们解释什么是可能性。假设我们有两种类型的证据,表示,如果我们看到交易的正常或奇怪的地理位置。
的可能性可能很小,这意味着给定正常的交易,该位置不太可能是奇怪的。另一方面,可以很大。
假设,我们观察到,我们想看看它是否是欺诈,我们需要同时考虑先验和可能性。直觉上,从之前的情况来看,我们知道欺诈交易很少,除非证据非常有力,否则我们可能会非常保守地进行欺诈分类。因此,两者之间的产品会同时考虑两个因素。
2015 年 8 月 7 日中篇文章用许多图片解释!十分之一的人生病了。
为了简化这个例子,我们假设我们知道哪些是生病的,哪些是健康的,但是在真实的测试中你不知道这些信息。现在我们测试每个人的疾病:
真阳性 = 患病人群中阳性结果的数量 = #(Positive | Sick) = 9。
现在有趣的问题是,如果检测呈阳性,生病的概率是多少?在数学中,