从连续分布中采样单个值在逻辑上是如何可能的?

机器算法验证 可能性 最大似然 连续数据 哲学的
2022-03-27 16:29:52

例如,假设有人告诉我 10 个数据点来自具有一定均值和方差的正态分布的 IID。实现这些值的概率不是为零吗?绘制每个数据点的概率为零的事实不应该意味着可能性为零吗?例如,为什么我可以采样特定值而不是被迫采样间隔?

我知道用计算机模拟连续随机变量的绘制是一个有用的虚构,因为没有计算机具有无限的精度。但是,有时会出现问题,即数据点实际上来自连续分布,而不是连续分布的离散近似。

这在逻辑上似乎是不可能的,或者至少零概率应该反映在可能性计算中。在介绍概率课程中有很多关于连续 RV 以零概率取标量值的评论,但是当您被告知数据是来自连续分布的 IID 时,在统计课程中从未提及这一点。

我知道这个问题很简单,但我在任何地方都没有看到令人满意的答案。

1个回答

这是因为零概率不应与不可能混为一谈。当然,必须对一些值进行采样,所以与其观察那个数字并自言自语“我观察到这个的概率是多少?” 然后被答案弄糊涂了,随意选择一个数字,然后抽取样本,直到得到那个数字。它永远不会发生。这更好地说明了这个想法。

顺便说一句,这纯粹是思想实验,因为据我所知,实际上不可能从连续分布中采样,这实际上只是一种数学抽象。(例如考虑有多少所谓的统一(0,1)曾经产生的随机数是非理性的,这是一个应该有概率为一的事件。)