我知道这是重复的,但我认为问题有点不同,需要不同的答案。
CDF如何是连续的,并且在每个点处的导数都不为零,但每个点的概率为零?
例如,如果你想选择一个介于 0 和 1 之间的实数,为什么不说概率是 1/N?这只是微不足道的。(只是描述情况的一个例子。)
它既不能是有限的也不能是零
不同之处在于:为什么不给它分配一个无穷小而不是零,并说 P = 0 的事件可以发生?
我知道这是重复的,但我认为问题有点不同,需要不同的答案。
CDF如何是连续的,并且在每个点处的导数都不为零,但每个点的概率为零?
例如,如果你想选择一个介于 0 和 1 之间的实数,为什么不说概率是 1/N?这只是微不足道的。(只是描述情况的一个例子。)
它既不能是有限的也不能是零
不同之处在于:为什么不给它分配一个无穷小而不是零,并说 P = 0 的事件可以发生?
零概率并不意味着事件不会发生!这意味着概率度量给事件(一组结果)的度量为零。
正如@Aksakai 的回答所指出的,无限数量的零宽度点的并集可以形成正宽度线段,同样,无限数量的零概率事件的并集可以形成正概率事件。
这真的不是一个统计问题。这是一个真正的分析问题。例如,它几乎等同于问“直线上的点的宽度是多少?” (顺便说一句,答案是零)
这是一个有趣的情况。在数学中,线被定义为一组点。这些点有一定的几何约束,例如,它们形成一条线而不是圆。然而,这不是最重要的。
重要的是这个。如果每个点的宽度为零,而线是一组点,那么它所有点的宽度之和为什么不为零?你加两个零,它给你一个零。如果我继续以这种方式添加,线的长度不应该为零吗?显然不是!
这与您要问的问题相同。为什么每个点的概率都是零,而总概率却是一?这个问题之所以相同,是因为概率与两点之间的直线长度的概念密切相关。现代概率论的核心概念是测度的概念。毫不奇怪,它源于所有度量中最简单的度量:几何中的长度。
如果你想要一个捷径来理解这个令人难以置信的绑定,那么请查找可数集和不可数集的概念。注意无限可数集和不可数集之间的区别。两者都有无限多的点,但后者有更多的点(完全疯狂!)。所以离散和连续随机变量(及其分布)与这两种集合有关。
更新
示例:在英语中有可数名词和不可数名词,例如 apple vs. milk。我想问你一个苹果有多重?你可以说这批是半磅。但是,如果我问牛奶的重量是多少,如果不指定诸如一品脱或一夸脱之类的数量,那将是没有意义的。
在这方面,离散随机变量及其概率就像苹果及其权重。例如,您可以说泊松变量 1 的概率是 10%。
连续随机变量就像牛奶。询问给定值的概率是没有意义的,您需要指定存储桶。比如说,对于标准正态(高斯)变量,您可以询问它们的值介于 0 和 1 之间的概率是多少,答案大概是 34%。然而,1 的概率在实际意义上几乎没有意义。您可以计算密度但你打算用它做什么?这不是概率。同样,如果您对牛奶的重量感兴趣,牛奶的密度不是答案,您需要指定容器尺寸,然后我们可以使用其密度告诉您重量。这就是为什么概率密度函数实际上被称为密度,它源于物体的密度。
我认为想象该点下的区域是有帮助的。连续分布的概率是来自 (a,b) 的 PDF 的积分。如果您选择一个点(a,a),是否有任何区域?想象一下像均匀分布这样的简单 PDF 进行数学运算。
PS 不,但如果你问足够多的数学家,1/20 会说是。但是,我会接受 null5%。