机器算法验证 - 连续随机变量中每个点的概率如何为零？ - 吾爱随笔录

连续随机变量中每个点的概率如何为零？

机器算法验证随机变量连续数据

2022-03-14 06:24:20

我知道这是重复的，但我认为问题有点不同，需要不同的答案。

CDF如何是连续的，并且在每个点处的导数都不为零，但每个点的概率为零？

例如，如果你想选择一个介于 0 和 1 之间的实数，为什么不说概率是 1/N？这只是微不足道的。（只是描述情况的一个例子。）

它既不能是有限的也不能是零

不同之处在于：为什么不给它分配一个无穷小而不是零，并说 P = 0 的事件可以发生？

3个回答

猜测您的困惑点：

零概率并不意味着事件不会发生！这意味着概率度量给事件（一组结果）的度量为零。

正如@Aksakai 的回答所指出的，无限数量的零宽度点的并集可以形成正宽度线段，同样，无限数量的零概率事件的并集可以形成正概率事件。

更多解释：

我们对离散概率的直觉是，如果一个结果的概率为零，那么这个结果是不可能的。如果从一副牌中抽到黑桃A的概率为零，这意味着黑桃A不在这副牌中！
对于连续的随机变量（或更一般地说，无限数量的可能结果），直觉是有缺陷的。
- 概率测量零事件可能发生。措施一事件不必发生。如果一个事件的概率测度为 1，你说它几乎肯定会发生。几乎注意关键词！这肯定不会发生。
- 如果你想说一个事件是不可能的，你可能会说它是“在支持之外”。支持的内部和外部是一个很大的区别。
- 松散地说，测量零事件的无限总和可以加起来是积极的。你需要一个无限的总和。线段上的每个点的宽度为零，但总的来说，它们具有正宽度。

这真的不是一个统计问题。这是一个真正的分析问题。例如，它几乎等同于问“直线上的点的宽度是多少？” （顺便说一句，答案是零）

这是一个有趣的情况。在数学中，线被定义为一组点。这些点有一定的几何约束，例如，它们形成一条线而不是圆。然而，这不是最重要的。

重要的是这个。如果每个点的宽度为零，而线是一组点，那么它所有点的宽度之和为什么不为零？你加两个零，它给你一个零。如果我继续以这种方式添加，线的长度不应该为零吗？显然不是！

这与您要问的问题相同。为什么每个点的概率都是零，而总概率却是一？这个问题之所以相同，是因为概率与两点之间的直线长度的概念密切相关。现代概率论的核心概念是测度的概念。毫不奇怪，它源于所有度量中最简单的度量：几何中的长度。

如果你想要一个捷径来理解这个令人难以置信的绑定，那么请查找可数集和不可数集的概念。注意无限可数集和不可数集之间的区别。两者都有无限多的点，但后者有更多的点（完全疯狂！）。所以离散和连续随机变量（及其分布）与这两种集合有关。

更新
示例：在英语中有可数名词和不可数名词，例如 apple vs. milk。我想问你一个苹果有多重？你可以说这批是半磅。但是，如果我问牛奶的重量是多少，如果不指定诸如一品脱或一夸脱之类的数量，那将是没有意义的。

在这方面，离散随机变量及其概率就像苹果及其权重。例如，您可以说泊松变量 1 的概率是 10%。

连续随机变量就像牛奶。询问给定值的概率是没有意义的，您需要指定存储桶。比如说，对于标准正态（高斯）变量，您可以询问它们的值介于 0 和 1 之间的概率是多少，答案大概是 34%。然而，1 的概率在实际意义上几乎没有意义。您可以计算密度 $x=1$ 但你打算用它做什么？这不是概率。同样，如果您对牛奶的重量感兴趣，牛奶的密度不是答案，您需要指定容器尺寸，然后我们可以使用其密度告诉您重量。这就是为什么概率密度函数实际上被称为密度，它源于物体的密度。

我认为想象该点下的区域是有帮助的。连续分布的概率是来自 (a,b) 的 PDF 的积分。如果您选择一个点（a，a），是否有任何区域？想象一下像均匀分布这样的简单 PDF 进行数学运算。

PS 不，但如果你问足够多的数学家，1/20 会说是。但是，我会接受 null $\alpha$ 5%。

其它你可能感兴趣的问题

上一篇非信息性和不当先验之间的区别下一篇自举样本的大小