为什么累积分布函数 (CDF) 唯一地定义分布?

机器算法验证 可能性 分布 密度函数 累积分布函数
2022-01-31 23:57:23

我一直被告知 CDF 是唯一的,但 PDF/PMF 不是唯一的,为什么会这样?你能举一个 PDF/PMF 不是唯一的例子吗?

3个回答

让我们回忆一些事情。概率空间是我们的样本集,是我们的 -代数,是定义在上的概率函数。随机变量是一个可测量的函数中的任何 Lebesgue 可测量子集如果你不熟悉这个概念,那么我之后所说的一切都没有任何意义。(Ω,A,P)ΩAσPAX:ΩRX1(S)AR

每当我们有一个随机变量时,它都会通过分类前推上引入一个概率测度换句话说,检查上的概率测度是微不足道的我们称分布X:ΩRXRX(S)=P(X1(S))XRXX

现在与这个概念相关的是函数变量的分布函数给定一个随机变量我们定义分布函数具有以下性质:X:ΩRF(x)=P(Xx)F:R[0,1]

  1. F右连续的

  2. F不减

  3. F()=1F()=0

显然,相等的随机变量具有相同的分布和分布函数。

反转这个过程并获得具有给定分布函数的度量是非常技术性的。假设给您一个分布函数定义。你必须证明区间的半代数的度量。之后你可以应用Carathéodory扩展定理上的概率测度F(x)μ(a,b]=F(b)F(a)μ(a,b]μR

要回答对具有相同积分(即具有相同分布函数)的两个密度示例的请求,请考虑在实数上定义的这些函数:

 f(x) = 1 ; when x is odd integer
 f(x) = exp(-x^2)  ; elsewhere

进而;

 f2(x) = 1  ; when x is even integer
 f2(x) = exp(-x^2) ;  elsewhere

它们根本不相等 x,但都是相同分布的密度,因此密度不是由(累积)分布唯一确定的。当具有实域的密度仅在一组可数的 x 值上不同时,积分将相同。数学分析真的不适合胆小的人或确定具体的头脑。

我不同意您在开场问题中所说的“概率分布函数不能唯一地确定概率度量”的说法。它确实唯一地确定了它。

是两个概率质量函数。如果, 对于任何可测集几乎无处不在。这唯一地确定了 pdf(因为在分析中我们不关心他们是否在一组测量零上存在分歧)。f1,f2:R[0,)

Ef1=Ef2
Ef1=f2

我们可以将上面的积分重写为, 其中是一个可积函数。

Eg=0
g=f1f2

定义,所以我们使用众所周知的定理,如果非负函数的积分为零,则该函数几乎处处为零。特别是, ae 所以 ae 在上。在另一个方向重复这个参数。上得到 ae 因此, ae E={xR | g0}Eg=0g=0Ef1=f2EF={xR | g0}f1=f2Ff1=f2EF=R