离散随机变量的性质

机器算法验证 随机变量 离散数据
2022-03-13 02:35:34

我的统计课程只是告诉我离散随机变量有有限数量的选项......我没有意识到这一点。我会认为,就像一组整数一样,它可能是无限的。谷歌搜索和检查几个网页,包括一些来自大学课程的网页,都未能明确证实这一点;然而,大多数网站确实说离散随机变量是可数的- 我想这意味着有限编号?

很明显,即使(大多数?)经常有界,连续随机变量也是无限的。

但是,如果离散随机变量具有有限的可能性,那么整数的无限分布是什么?它既不离散也不连续?这个问题是否没有实际意义,因为变量往往是连续的和(根据定义)无限或不连续的和有限的?

3个回答

如果你的课程是这样说的,那就错了。

虽然离散分布可以有有限数量的可能结果,但它们不是必须的;你可以有一个离散分布,它有无限数量的可能结果——元素的数量应该不超过可数。

一个常见的例子是几何分布。考虑投掷一枚公平硬币的次数,直到你得到正面。可能需要的投掷次数没有有限的上限。可能需要掷 1 次,或 2 次,或 3 次,或 100 次,或任何其他次数。

离散分布可能是负数(考虑两个这样的几何分布随机变量之间的差异;它可以是任何正整数或负整数)。

不过,就像我的示例一样,离散分布不必超过整数。这只是一种常见的情况,不是必需的。

我正在写一个答案,认为我对测度理论概率只有非常幼稚的理解(所以,专家,请​​纠正我!)。

(实值)随机变量是一个函数X:SR, 在哪里S是一个样本空间。

X是离散的,如果X(S), 的图像S由...介绍X, 是可数的。X是连续的,如果X具有绝对连续的 CDF(我对绝对连续函数了解不多,所以我无法详细说明这一点。)

然而,并不是所有的随机变量都只是离散的或连续的。存在“混合”随机变量,其中X(s)有一个 CDF,它是一个阶跃函数和一个带指标的连续函数之和。

您还可以有既不离散也不连续的随机变量,例如康托尔分布

引用关于连续变量和离散变量的维基百科页面

如果它[变量]可以取两个特定的实数值,这样它也可以取它们之间的所有实数值(即使是任意接近的值),则该变量在该区间内是连续的

因此,离散随机变量不必具有“有限数量的选项”,但可能值之间需要存在非无穷小的差距。整数分布就是这种情况,因为两个相邻整数之间的“距离”是 1 并且不能小于这个。因此,变量不是连续的,因为它不会在这些间隙内“继续”。

编辑:我知道可能有更好和/或更精确的方法来回答这个问题,但这就是帮助我个人理解差异的原因。