为什么连续均匀分布中的概率之和不是无穷大?

机器算法验证 可能性 分布 均匀分布
2022-03-18 05:37:13

概率密度函数

均匀分布(连续)的概率密度函数如上所示。曲线下面积为 1 - 这是有道理的,因为概率分布中所有概率的总和为 1。

形式上,上述概率函数 (f(x)) 可以定义为

1/(ba) 对于 [a,b] 中的 x

否则为 0

考虑到我必须在 a(比如 2)和 b(比如 6)之间选择一个实数。这使得均匀概率 = 0.25。但是,由于在该区间中有无限数量的数字,所有概率的总和不应该是无穷大吗?我在看什么?

f(x) 不是数字 x 出现的概率吗?

4个回答

f(x)在您的示例中描述概率密度而不是概率质量。一般来说,对于连续分布事件(我们得到概率的事物)是值的范围,例如从或从的曲线下面积(尽管这些范围不必是连续的) . 对于连续分布,任何单个值出现的概率通常为 0。aa+.1ab

因为求和中的每一项都由无穷小的 d加权。通过仔细浏览一个非常基本的示例,可能最容易理解这一点的重要性。x

考虑使用黎曼求和来计算以下矩形区域下的面积(选择一个矩形来去除黎曼求和的近似方面,这不是这里的重点): 矩形区域] 我们可以使用 2 个子区域或使用 4 个子区域来计算面积. 在 2 个子区域(表示为)的情况下,面积由给出,而在 4 个子区域(表示为)的情况下,面积由两种情况下的总面积对应于 20一个微妙的重要问题是:为什么这两个答案一致Ai

A1=A2=5×2=10
Bi
B1=B2=B3=B4=5×1=5
i=12Ai=i=14Bi=20
? 直觉上应该很清楚它是有效的,因为我们减少了第二组子区域的宽度我们可以考虑用 8 个子区域做同样的事情,每个子区域的宽度为,然后再用 16 个......我们可以继续这个过程,直到我们有无限数量的子区域,每个子区域的宽度都很小 d只要所有内容的权重始终正确,答案就应该始终一致。如果没有正确的加权,总和确实只是0.5x

这就是为什么我总是确保向学生指出,积分不仅仅是符号,而是符号dx

您以错误的方式解释概率分布 - 它是无限数量的无限分割概率,因此您不能说“从 (0, 1) 均匀分布中提取值 0.5 的概率”,因为该概率是零 - 您可以获得无限数量的可能值并且所有这些值的可能性都相同,因此显然任何单个结果的概率是 [1]1=0

相反,您可以查看一系列结果的概率,并使用面积(以及积分)来衡量。例如,如果您从 (0, 1) 均匀分布中得出(对于否则),那么概率您的结果介于之间是f(x)=1x[0,1]f(x)=00.20.3

0.20.3f(x) dx=0.20.31 dx=[x]0.20.3=0.30.2=0.1

即,您有 10% 的机会获得该范围内的结果。

[1]对我过度简化的计算让所有心脏病发作的人感到抱歉。

f(x)描述概率密度,单位为因此,对于给定的 x,您会得到,而不是您正在寻找的 p。如果你想要 p,你需要给定范围的分布函数,即 x 在 a 和 b 内的概率 p。pxf(x)=1bapx

希望这是有道理的。