pdf 和 pmf 和 cdf 是否包含相同的信息?

机器算法验证 可能性 分布 密度函数 推理 累积分布函数
2022-02-02 05:12:09

pdf 和 pmf 和 cdf 是否包含相同的信息?

对我来说,pdf给出了某个点的整个概率(基本上是概率下的区域)。

pmf 给出了某个点的概率。

cdf 给出了某个点下的概率。

所以对我来说 pdf 和 cdf 具有相同的信息,但 pmf 没有,因为它给出了分布上一个点的概率x

3个回答

如果区分概率函数和密度*,则 pmf 仅适用于离散随机变量,而 pdf 适用于连续随机变量。

* 正式方法可以包含两者并使用一个术语来表示它们

cdf 适用于任何随机变量,包括既没有 pdf 也没有 pmf 的随机变量

在此处输入图像描述

(例如混合分布——例如,考虑一天的降雨量,或财产保险单索赔中支付的金额,其中任何一个都可以通过零膨胀连续分布建模)。

随机变量的 cdfXP(Xx)

离散随机变量的 pmfX, 给出P(X=x).

pdf本身并不给出概率,而是相对概率;连续分布没有点概率。要从 pdf 中获取概率,您需要在某个区间内进行积分 - 或取两个 cdf 值的差值。

很难回答“它们是否包含相同的信息”这个问题,因为这取决于您的意思。您可以从 pdf 到 cdf(通过集成),从 pmf 到 cdf(通过求和),从 cdf 到 pdf(通过微分)和从 cdf 到 pmf(通过差分),所以当你有 pmf 或 pdf ,它包含与 cdf 相同的信息。

PMF 与离散随机变量相关联,PDF 与连续随机变量相关联。对于任何类型的随机变量,CDF 总是存在(并且是唯一的),定义为

FX(x)=P{Xx}.
现在,取决于随机变量的支持集X,密度(或质量函数)不必存在。(考虑康托集和康托函数,通过去除单位区间的中心 1/3 递归定义集合,然后对区间 (0, 1/3) 和 (2/3, 1) 等重复该过程. 函数定义为C(x)=x, 如果x是在康托尔集中,并且在康托尔集中的最大下界如果x不是成员。)康托尔函数是一个非常好的分布函数,如果你加上C(x)=0如果x<0C(x)=1如果1<x. 但是这个 cdf 没有密度:C(x)处处连续,但其导数几乎处处为 0。没有关于任何有用度量的密度。

因此,您的问题的答案是,如果存在密度或质量函数,那么它是 CDF 关于某个度量的导数。从这个意义上说,它们携带“相同”的信息。但是,PDF 和 PMF 不必存在。CDF 必须存在。

其他答案指出 CDF 是基本的并且必须存在,而 PDF 和 PMF 不是而且不一定存在。

这让我(作为一名非统计学家)感到困惑和好奇,因为当样本空间未排序时,我不知道如何解释 CDF(或它可能如何存在);例如,想想圆S1.

在我看来,答案是基本函数是概率测度,它将样本空间的每个(考虑的)子集映射到概率。然后,当它们存在时,CDF、PDF 和 PMF 来自概率测度。