机器算法验证 - 概率测度与概率分布的差异 - 吾爱随笔录

概率测度与概率分布的差异

机器算法验证可能性分布正态分布测度论

2022-02-17 08:02:04

我试图更好地理解“概率度量”和“概率分布”的区别

我遇到了以下链接：https ://math.stackexchange.com/questions/1073744/distinguishing-probability-measure-function-and-distribution

” “概率测度”和“概率分布”这两个术语的区别在某些方面更多的是术语内涵的区别，而不是术语所指事物之间的区别。更多的是关于术语的使用方式。”

这里的答案表明这两个概念可能是同一件事？

在这种情况下 -我们可以将“正态概率分布函数”视为“概率度量”吗？

谢谢！

4个回答

首先，我不习惯“概率分布函数”这个术语。如果您在使用“概率分布函数”时指的是“PDF”，那么我想指出 PDF 是“概率密度函数”的缩写。下面，我假设您的意思是概率密度函数。

其次，“分布”这个词，不同的人用的很不一样，但我会参考科学界对这个概念的定义。

简而言之：随机变量的分布是对的度量，而的 PDF是对的函数，而且 PDF 甚至不总是存在。所以他们是非常不同的。 $X$ $\mathbb{R}$ $X$ $\mathbb{R}$

现在我们来了解数学细节：首先，让我们定义术语随机变量，因为这是所有这些术语通常所指的（除非你更进一步想要谈论随机向量或随机元素，但我会限制这个这里是随机变量）。即，您谈论随机变量的分布。

给定一个概率空间 (只是一个集合，上的一个 sigma 代数，是 )，随机变量是一个可测量的映射。 $(\Omega, \cal{F}, p)$ $\Omega$ $\cal{F}$ $\Omega$ $p$ $(\Omega, \cal{F})$ $X$ $X: \Omega \to \mathbb{R}$

然后我们可以定义：随机变量的分布是在上的测度 $p_X$ $X$ $p_X = p \circ X^{-1}$ $\mathbb{R}.$

即你通过可测量函数从向前推到。 $p$ $\Omega$ $\mathbb{R}$ $X$

接下来我们定义随机变量 X 的密度函数(PDF)：随机变量X概率密度函数 ( PDF（如果存在）是其分布 wrt Lebesgue 测度的 Radon-Nikodym 导数，即。 $X$ $f_X$ $X$ $\lambda$ $f_X = \frac{d\,p_X}{d\,\lambda}$

因此，随机变量的分布和 PDF是非常不同的实体（至少对于坚持者而言）。但很多时候，如果 PDF存在，它包含有关分布的所有相关信息，因此可以用作笨重的的方便替代品。 $p_X$ $f_X$ $f_X$ $p_X$ $p_X$

“概率分布”的概念是一个概括性术语，指的是可以以多种方式唯一表示的特定类型的对象。表示概率分布的一种方法是通过其概率测度，另一种是通过其特征函数，另一种是通过其累积分布函数，另一种是通过其概率密度函数。（包括对密度的主要度量的规范）。所有后者都是以不同方式描述概率分布的特定数学对象。术语“概率分布”不是指特定的数学对象；它可以被认为是一个总括性术语，整体上指的是这些对象中的每一个所描述的“事物”。

你是对的，当我们刚刚开始我们的统计研究时，这些术语可能会让人非常困惑，尤其是对于那些非常注重细节或对术语非常挑剔的人来说。在你掌握它们的应用之前，你确实需要对这里有很好的理解。并且使用诸如 pnorm()、dnorm() 之类的 R 函数会迫使您理解这些。

我想说你引用的帖子说得很好——尤其是它指出“概率函数”——“概率密度函数”和“概率质量函数”是精确定义的，其他术语可以理解为它们的名称建议-“概率度量”是概率的度量-它是累积的还是不累积的？它没有说。这是一个度量，所以它可以参考两者。概率分布可以是相似的。但不要将其与分布函数混淆。分布函数在大多数情况下是指“累积分布函数”，它也明确定义为取值等于或小于指定值的概率。

也许一个例子可以帮助

这是一个简单的正态分布图。和这里，

概率函数——这里是概率密度函数，因为它是连续变量——描述了红色曲线。这是一条线，由这个函数表示其中，是平均值，是标准差。
$f (x) = \frac{1}{σ \sqrt{2 π}} e^{- \frac{1}{2} (\frac{x - μ}{σ})^{2}}$ $\large{f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}(\frac{x-\mu}{\sigma})^2}}$ $\mu$ $\sigma$
在这条“红线”下计算积分会得到不同的“概率”值——例如，橙色区域是一个距离平均值 1 个标准差的区域，占总面积的 34%——概率为 34%；而蓝色区域代表 17% 的概率。我想说整个图表描绘了正态分布的概率是一个概率度量和一个概率分布。但只有准确的红线是概率函数，或者更具体地说，是概率密度函数。

不要过分强调“概率度量”/“概率分布”的确切定义。我相信当你看到更多的例子时，你会觉得使用这些术语很舒服。

您提到了 mathstack 的帖子：https ://math.stackexchange.com/questions/1073744/distinguishing-probability-measure-function-and-distribution 那里的答案很好，它们应该是自给自足的。如果他们对数学细节感兴趣，我建议任何人去阅读它。

如果您在这里问“相同”的问题，这可能是因为您不熟悉概率论的术语和数学。

我不喜欢其他答案的是他们关注的是密度而不是真正重要的东西：分布和度量。

出于这个原因，这里有一些针对非专业数学家的词汇。这是一个非常快速和肮脏的演示文稿：

功能分析：

分布是您在泛函分析中开发的数学对象，您无需了解此处的详细信息。见https://en.wikipedia.org/wiki/Distribution_(mathematics)

密度是从良好场景中的分布产生的概念。当一切都很好时，密度是分布的导数。

概率论：

累积分布函数，它是一个“标准化”分布，因此它在整个域上的值等于（如果你愿意， ), $1$ $\mathbb R$ $\lim_{x \to \infty } F_X( x ) = 1$

概率密度函数，同上，但用于累积分布。

测量理论：

随机变量：它本质上是一个可测量的函数。如果您不理解这一点，请跳过它，稍后再返回此主题。现在将其视为一个函数。所有可测函数都是函数，但并非所有函数都是可测函数。然而，在大多数情况下，你能想到的都是可以衡量的。

测度：测度是从集合到实数的函数。换句话说，它赋予元素集权重。措施必须尊重一些我在这里不详述的属性。

概率测度：概率测度是标准化的测度，使得整个空间的测度等于。 $1$

既然我们知道了词汇表，那么您应该了解的重要定理是：

随机变量总是与 CDF（累积分布函数）相关联。一个没有另一个是不可能的。如果我明确定义，您可以找到的 CDF创造。 $X$ $X$ $F_X$
对于每个 CDF，都存在一个唯一的关联概率测度。

这是什么意思？这意味着如果你从一个随机变量开始，你就有一个 CDF，它对应于一个度量！反过来！

额外的好处是，当 PDF（概率密度函数）等价于 CDF（从某种意义上说，CDF 的导数等于 PDF，而 PDF 的反导数给出了 CDF），那么我所说的关于CDF（它唯一地表征随机变量）也适用于 PDF！请注意 PDF 和 CDF 不等价的情况。

结论是，是的，分布和度量是等价的。如果你有一个，你可以构建另一个。这很棒，因为它简化了许多情况，您可以只计算出更容易使用的表达式。

其它你可能感兴趣的问题

上一篇为什么当中位数相等时 Mann-Whitney U 检验显着？下一篇为什么这个回归不会因为完美的多重共线性而失败，尽管一个变量是其他变量的线性组合？