连续随机变量中每个点的概率如何为零?

机器算法验证 随机变量 连续数据
2022-03-14 06:24:20

我知道这是重复的,但我认为问题有点不同,需要不同的答案。

CDF如何是连续的,并且在每个点处的导数都不为零,但每个点的概率为零?

例如,如果你想选择一个介于 0 和 1 之间的实数,为什么不说概率是 1/N?这只是微不足道的。(只是描述情况的一个例子。)

它既不能是有限的也不能是零

不同之处在于:为什么不给它分配一个无穷小而不是零,并说 P = 0 的事件可以发生?

3个回答

猜测您的困惑点:

零概率并不意味着事件不会发生!这意味着概率度量事件(一组结果)的度量为零。

正如@Aksakai 的回答所指出的,无限数量的零宽度点的并集可以形成正宽度线段,同样,无限数量的零概率事件的并集可以形成正概率事件。

更多解释:

  • 我们对离散概率的直觉是,如果一个结果的概率为零,那么这个结果是不可能的。如果从一副牌中抽到黑桃A的概率为零,这意味着黑桃A不在这副牌中!

  • 对于连续的随机变量(或更一般地说,无限数量的可能结果),直觉是有缺陷的。

    • 概率测量零事件可能发生。措施一事件不必发生。如果一个事件的概率测度为 1,你说它几乎肯定会发生。几乎注意关键词这肯定不会发生。
    • 如果你想说一个事件是不可能的,你可能会说它是“在支持之外”支持的内部和外部是一个很大的区别。
    • 松散地说,测量零事件的无限总和可以加起来是积极的。你需要一个无限的总和。线段上的每个点的宽度为零,但总的来说,它们具有正宽度。

这真的不是一个统计问题。这是一个真正的分析问题。例如,它几乎等同于问“直线上的点的宽度是多少?” (顺便说一句,答案是零)

这是一个有趣的情况。在数学中,线被定义为一组点。这些点有一定的几何约束,例如,它们形成一条线而不是圆。然而,这不是最重要的。

重要的是这个。如果每个点的宽度为零,而线是一组点,那么它所有点的宽度之和为什么不为零?你加两个零,它给你一个零。如果我继续以这种方式添加,线的长度不应该为零吗?显然不是!

这与您要问的问题相同。为什么每个点的概率都是零,而总概率却是一?这个问题之所以相同,是因为概率与两点之间的直线长度的概念密切相关。现代概率论的核心概念是测度的概念。毫不奇怪,它源于所有度量中最简单的度量:几何中的长度。

如果你想要一个捷径来理解这个令人难以置信的绑定,那么请查找可数集和不可数集的概念。注意无限可数集和不可数集之间的区别。两者都有无限多的点,但后者有更多的点(完全疯狂!)。所以离散和连续随机变量(及其分布)与这两种集合有关。

更新
示例:在英语中有可数名词和不可数名词,例如 apple vs. milk。我想问你一个苹果有多重?你可以说这批是半磅。但是,如果我问牛奶的重量是多少,如果不指定诸如一品脱或一夸脱之类的数量,那将是没有意义的。

在这方面,离散随机变量及其概率就像苹果及其权重。例如,您可以说泊松变量 1 的概率是 10%。

连续随机变量就像牛奶。询问给定值的概率是没有意义的,您需要指定存储桶。比如说,对于标准正态(高斯)变量,您可以询问它们的值介于 0 和 1 之间的概率是多少,答案大概是 34%。然而,1 的概率在实际意义上几乎没有意义。您可以计算密度x=1但你打算用它做什么?这不是概率。同样,如果您对牛奶的重量感兴趣,牛奶的密度不是答案,您需要指定容器尺寸,然后我们可以使用其密度告诉您重量。这就是为什么概率密度函数实际上被称为密度,它源于物体的密度。

我认为想象该点下的区域是有帮助的。连续分布的概率是来自 (a,b) 的 PDF 的积分。如果您选择一个点(a,a),是否有任何区域?想象一下像均匀分布这样的简单 PDF 进行数学运算。

PS 不,但如果你问足够多的数学家,1/20 会说是。但是,我会接受 nullα5%。