pdf 和 pmf 和 cdf 是否包含相同的信息?
对我来说,pdf给出了某个点的整个概率(基本上是概率下的区域)。
pmf 给出了某个点的概率。
cdf 给出了某个点下的概率。
所以对我来说 pdf 和 cdf 具有相同的信息,但 pmf 没有,因为它给出了分布上一个点的概率x
。
pdf 和 pmf 和 cdf 是否包含相同的信息?
对我来说,pdf给出了某个点的整个概率(基本上是概率下的区域)。
pmf 给出了某个点的概率。
cdf 给出了某个点下的概率。
所以对我来说 pdf 和 cdf 具有相同的信息,但 pmf 没有,因为它给出了分布上一个点的概率x
。
如果区分概率函数和密度*,则 pmf 仅适用于离散随机变量,而 pdf 适用于连续随机变量。
* 正式方法可以包含两者并使用一个术语来表示它们
cdf 适用于任何随机变量,包括既没有 pdf 也没有 pmf 的随机变量
(例如混合分布——例如,考虑一天的降雨量,或财产保险单索赔中支付的金额,其中任何一个都可以通过零膨胀连续分布建模)。
随机变量的 cdf给
离散随机变量的 pmf, 给出.
pdf本身并不给出概率,而是相对概率;连续分布没有点概率。要从 pdf 中获取概率,您需要在某个区间内进行积分 - 或取两个 cdf 值的差值。
很难回答“它们是否包含相同的信息”这个问题,因为这取决于您的意思。您可以从 pdf 到 cdf(通过集成),从 pmf 到 cdf(通过求和),从 cdf 到 pdf(通过微分)和从 cdf 到 pmf(通过差分),所以当你有 pmf 或 pdf ,它包含与 cdf 相同的信息。
PMF 与离散随机变量相关联,PDF 与连续随机变量相关联。对于任何类型的随机变量,CDF 总是存在(并且是唯一的),定义为
因此,您的问题的答案是,如果存在密度或质量函数,那么它是 CDF 关于某个度量的导数。从这个意义上说,它们携带“相同”的信息。但是,PDF 和 PMF 不必存在。CDF 必须存在。
其他答案指出 CDF 是基本的并且必须存在,而 PDF 和 PMF 不是而且不一定存在。
这让我(作为一名非统计学家)感到困惑和好奇,因为当样本空间未排序时,我不知道如何解释 CDF(或它可能如何存在);例如,想想圆.
在我看来,答案是基本函数是概率测度,它将样本空间的每个(考虑的)子集映射到概率。然后,当它们存在时,CDF、PDF 和 PMF 来自概率测度。