连续随机变量假设固定点的概率

机器算法验证 可能性 数理统计 随机变量 密度函数 连续数据
2022-03-28 15:38:42

我在一个介绍性统计课程中,其中连续随机变量的概率密度函数被定义为我了解的积分,但我无法用我对连续随机变量的直觉来纠正这一点。P{XB}=Bf(x)dxaaf(x)dx=0

假设 X 是随机变量,等于火车到达时间 t 的分钟数。如何计算火车从现在起正好 5 分钟到达的概率?这个概率怎么可能为零?不可能吗?如果火车确实在 5 分钟后到达,如果它的概率为 0,怎么会发生呢?

4个回答

您可能会陷入将“从现在起五分钟”视为持续某个有限时间段的陷阱(这将具有非零概率)。

连续变量意义上的“五分钟后”确实是瞬时的。

假设下一班火车的到达时间均匀分布在 8:00 到 8:15 之间。进一步想象我们将火车的到达定义为发生在火车前部通过车站上的特定点的那一刻(如果没有更好的地标,可能是站台的中点)。考虑以下概率序列:

a) 火车在 8:05 到 8:10 之间到达的概率

b) 火车在 8:05 到 8:06 之间到达的概率

c) 火车在 8:05:00 到 8:05:01 之间到达的概率

d) 火车在 8:05:00 到 8:05:00.01 之间到达的概率(即在百分之一秒的时间内)

e) 火车在 8:05 到十亿分之一秒后到达的概率

f) 火车在 8 点 05 分到十亿分之一秒后到达的概率

... 等等

它恰好8:05 到达的概率是这样一系列概率的极限值。概率小于每个ϵ>0

如果火车确实在 5 分钟后到达,如果它的概率为 0,怎么会发生呢?

概率陈述不是关于事件的可能性/可行性的陈述。它只反映了我们试图量化我们对它发生的不确定性的尝试。因此,当一种现象是连续的(或被建模为一种现象)时,我们的工具和当前的知识状态不允许我们对它采用特定值做出概率性陈述我们只能对一个范围做出这样的声明的价值观。当然,这里通常的技巧是离散化支持,考虑值的“小”间隔而不是单个值。由于与离散随机变量相比,连续随机变量带来了巨大的好处和灵活性,因此发现这是一个相当小的代价,可能与我们被迫考虑的间隔一样小。

为了让您对上述内容有一些直觉,请尝试以下(思想)实验:

用尺子在零周围画一条实线。现在拿起一个锋利的飞镖,让它从上面随机落到线上(假设你总是会击中线,为了论证,只有横向定位很重要)。

无论多少次你让飞镖随机落在线上,你永远都不会击中零点。为什么?想想什么是零点,想想它的宽度是多少。而当你认识到它的宽度为0之后,你还认为你能打到它吗?

你能达到第 1 点还是 -2 点?或者您为此选择的任何其他点?

回到数学,这是物理世界和数学概念(如实数)之间的区别(在我的示例中由实线表示)。概率论对概率的定义比你在讲座中看到的要复杂得多。要量化事件的概率及其结果的任何组合,您需要一个概率度量。Borel 测度Lebesgue 测度为实线上的区间 [a, b] 定义为: 从这个定义中,您可以看到如果减小区间,概率会发生什么到一个数字(设置 a = b)。

μ([a,b])=ba

底线是,根据我们目前对概率论的定义(可追溯到 Kolmogorov),事件的概率为 0 并不意味着它不会发生。

就您的火车示例而言,如果您将拥有无限精确的手表,那么您的火车将永远不会准时到达。

概率分布必须有一个统一的区域。如果测量是连续的,那么它可以取无限数量的值(即沿分布的 x 轴有无限数量的值)。概率分布的总面积可以是有限的唯一方法是使无限数量的值中的每一个的值为零。一除以无穷。

在“现实生活”中,没有任何措施可以采用无限数量的值(通过几个在这里无关紧要的不同哲学论点),因此没有值需要采用恰好为零的概率。一个有用的实用论点是基于实际测量的有限精度。如果您使用的秒表可以测量到十分之一秒,那么火车将有十分之一秒的时间在“正好”五分钟内到达。