请解释等待悖论

机器算法验证 泊松过程 悖论
2022-02-02 23:55:16

几年前,我设计了一种辐射探测器,它通过测量事件之间的间隔而不是计数来工作。我的假设是,在测量非连续样本时,我平均会测量实际间隔的一半。然而,当我用校准源测试电路时,读数是两倍高,这意味着我一直在测量整个间隔。

在一本关于概率和统计的旧书中,我找到了一个关于“等待悖论”的部分。它举了一个例子,其中一辆公共汽车每 15 分钟到达一个公共汽车站,而一名乘客随机到达,它表明乘客平均会等待整整 15 分钟。我从来没有能够理解这个例子所呈现的数学,并继续寻找一个解释。如果有人能解释为什么让乘客等待整个间隔,我会睡得更好。

4个回答

如果公共汽车“每 15 分钟”到达(即按时刻表),那么(随机到达的)乘客的平均等待时间确实只有 7.5 分钟,因为它将均匀分布在这 15 分钟的间隙中。

--

另一方面,如果公共汽车以平均每小时 4 班的速度随机到达(即根据泊松过程),那么平均等待时间要长得多;事实上,你可以通过缺乏记忆属性来解决这个问题。以乘客到达为起点,到下一个事件的时间是指数级的,平均为 15 分钟。

让我做一个离散时间的类比。想象一下,我正在滚动一个有 15 个面的骰子,其中一个标记为“B”(表示公共汽车)和 14 个标记为“X”,表示那一分钟完全没有公共汽车(公平的30 面骰子存在,所以我可以标记其中的 2 个) 30 面模具“B”的面)。所以我每分钟滚动一次,看看公共汽车是否来了。模具没有记忆;它不知道自上次“B”以来已经滚动了多少次。现在想象一些不相关的事件发生了——狗吠,乘客到达,我听到隆隆的雷声。从现在开始,我要等多久(多少卷)才能看到下一个“B”?

由于内存不足,平均而言,我等待下一个“B”的时间与两个连续“B”之间的时间相同。

[接下来想象我有一个60 面的骰子,我每 15 秒掷一次(同样,有一个“B”面);现在想象我有一个 1000 面骰子,我每 0.9 秒掷一次(有一个“B”面;或者更现实地说,每个骰子三个 10 面骰子,如果所有 3 个都出现“10”,我将结果称为“B”同时)...等等。在极限下,我们得到连续时间泊松过程。]

另一种看待它的方式是:我更有可能在较长的间隙而不是较短的间隙中观察我的“开始计数”(即“乘客到达公共汽车站”)事件,以正确的方式进行平均等待时间与公交车之间的平均等待时间相同(我大多在很长的间隔中等待,而大部分时间错过了最短的间隔;因为我到达的时间是均匀分布的,所以我在长度为 $t$ 的间隔中到达的机会是与 $t$ 成正比)

作为一名资深的公共汽车捕捉者,在实践中,现实似乎介于“公共汽车按计划到达”和“公共汽车随机到达”之间。有时(在交通不畅的情况下),你等了一个小时,然后 3 个同时到达(扎克在下面的评论中指出了原因)。

正如 Glen_b 所指出的,如果公交车每 15 美元一分钟到达,没有任何不确定性,我们知道最长可能的等待时间是 15 美元分钟。如果我们“随机”到达,我们觉得“平均而言”我们将等待最大可能等待时间的一半并且最大可能的等待时间在这里等于两个连续到达之间的最大可能长度。表示我们的等待时间 $W$ 和两个连续公交车到达之间的最大长度 $R$,我们认为

$$ E(W) = \frac 12 R = \frac {15}{2} = 7.5 \tag{1}$$

我们是对的。

但是突然间我们失去了确定性,我们被告知现在 15 美元的分钟是两辆公共汽车到达之间的平均时间。而我们陷入“直觉思维陷阱”,认为:“我们只需要将$R$替换为它的期望值”,我们争论不休

$$ E(W) = \frac 12 E(R) = \frac {15}{2} = 7.5\;\;\; \text{错误} \tag{2}$$

我们错了的第一个迹象是 $R$不是“任何两个连续的公共汽车到达之间的长度”,它是“最大长度等”。所以无论如何,我们有$E(R) \neq 15$。

我们是如何得出方程 $(1)$ 的?我们认为:“等待时间最多可以从 $0$ 到 $15$ 。我在任何情况下都以相同的概率到达,所以我随机且以相同的概率“选择”所有可能的等待时间。因此,两个连续公交车到达之间的最大长度的一半是我的平均等待时间”。我们是对的。

但是通过错误地在方程 $(2)$ 中插入值 $15$,它不再反映我们的行为。用 $15$ 代替 $E(R)$,方程 $(2)$ 表示“我随机选择所有可能的等待时间,这些等待时间小于或等于两个连续公交车到达之间的平均长度” - 并且这就是我们的直觉错误所在,因为我们的行为并没有改变——所以,通过均匀随机到达,我们实际上仍然“随机且以相等的概率选择”所有可能的等待时间——但没有捕捉到“所有可能的等待时间”减少 15 美元 - 我们忘记了两个连续巴士到达之间长度分布的右尾。

所以也许,我们应该计算任意两个连续公交车到站之间的最大长度的期望值,这是正确的解决方案吗?

是的,它可能是,但是:特定的“悖论”与特定的随机假设密切相关:公交车到达是由基准泊松过程建模的,这意味着因此我们假设之间的时间长度任何两个连续的公共汽车到达都遵循指数分布。用 $\ell$ 表示那个长度,我们有

$$f_{\ell}(\ell) = \lambda e^{-\lambda \ell},\;\; λ = 1/15,\;\; E(\ell) = 15$$

这当然是近似的,因为指数分布有来自右边的无限支持,这意味着严格来说“所有可能的等待时间”包括,在这个建模假设下,更大和更大的量级达到并“包括”无穷大,但概率为零.

但是等等,指数是无记忆的:无论我们将在什么时间点到达我们都会面对相同的随机变量,无论之前发生了什么。

鉴于这种随机/分布假设,任何时间点都是“两个连续公交车到达之间的间隔”的一部分,其长度由相同的概率分布描述,期望值(不是最大值)$15$:“我在这里,我我被两次巴士到达之间的间隔所包围。它的长度有些是过去的,有些是未来的,但我不知道有多少和多少,所以我能做的最好的就是问它的预期长度是多少-我的平均等待时间是多少?” - 答案总是“15 美元”,唉。

关于公共汽车的更多信息......很抱歉在讨论中这么晚才加入谈话,但我最近一直在研究泊松过程......所以在它滑出我的脑海之前,这里是检查悖论的图形表示:

谬误源于这样的假设,即由于公共汽车遵循特定的到达模式和给定的到达间隔平均时间(泊松率参数 $\lambda$ 的倒数,我们称之为 $\small \theta=1/\lambda= 15 美元分钟),通过在任何随机时间出现在公共汽车站,您实际上是在搭乘公共汽车。因此,如果您随机出现在公交车站,保留一份等待时间的日志,例如一个月,实际上将为您提供公交车之间的平均到达间隔时间。但这不是你要做的。

如果我们在调度中心,并且可以在屏幕上看到所有公交车,那么随机选择多辆公交车,然后平均到后面公交车的距离,将产生平均到达间隔时间:

在此处输入图像描述

但是,如果我们只是出现在公共汽车站(而不是选择公共汽车),我们就是在做一个随机的横截面时间,比如说,在一个典型的早晨沿着公共汽车时刻表的时间线。我们决定出现在公交车站的时间很可能沿着时间的“箭头”均匀分布。但是,由于总线之间的时间间隔越长,间隔越远,我们就越有可能最终对这些“落后者”进行过采样:

在此处输入图像描述

...因此,我们的等待时间日志不会反映到达间隔时间。这就是检验悖论。

至于 OP 上关于预期等待时间 $15'$, minutes 的实际问题,令人难以置信的解释在于泊松过程的无记忆性,这使得从我们错过的最后一辆公共汽车离开的时间间隔过去车站到我们出现的时间无关紧要,而下一辆公共汽车到达的预期时间仍然固执地是 $\theta=15$ 分钟。最好在离散时间(几何分布)中看到 Glen_b 答案中的骰子示例。

事实上,如果我们能知道前面的公交车离开多久,$\small \mathbb E[\text{等待时间(未来)+ 到最后一班车的时间(过去)}]=30$ min!正如John Tsitsiklis 在 MIT 视频中所解释的那样,我们只需要将到达点之前的内容视为泊松过程倒退


在此处输入图像描述


还不清楚吗?- 用乐高积木试试

有一个简单的解释可以解决不同的答案,即计算给定平均到达间隔时间(在这种情况下为 15 分钟)的泊松过程到达的公共汽车的预期等待时间,因此其到达间隔时间是 iid 指数,平均为 15 分钟.

方法 1 ) 因为泊松过程(指数)是无记忆的,所以预期的等待时间是 15 分钟。

方法 2 ) 您同样有可能在到达间隔期间的任何时间到达。因此,预期的等待时间是该到达间隔期预期长度的 1/2。这是正确的,并且与方法(1)不冲突。

(1)和(2)怎么可能都是正确的?答案是您到达时的预期间隔时间长度不是 15 分钟。实际上是30分钟;30 分钟的 1/2 是 15 分钟,所以 (1) 和 (2) 一致。

为什么您到达的时间间隔不等于 15 分钟?这是因为通过首先“确定”一个到达时间,它所处的到达间隔期比平均间隔期更可能是一个较长的到达间隔期。在指数到达间隔期的情况下,数学计算出来,因此包含您到达时间的到达间隔期是一个指数,是泊松过程的平均到达间隔时间的两倍。

包含您到达的时间的到达间隔时间的确切分布是否是具有双倍均值的指数并不明显,但很明显,经过解释,为什么它会增加。作为一个易于理解的示例,假设到达间隔时间为 10 分钟,概率为 1/2 或 20 分钟,概率为 1/2。在这种情况下,20 分钟长的到达间隔期与 10 分钟长的到达间隔期发生的可能性相同,但当它们确实发生时,它们持续的时间是 10 分钟的两倍。因此,一天中 2/3 的时间点将是到达间隔时间为 20 分钟的时间。换句话说,如果我们首先选择一个时间,然后想知道包含该时间的到达间隔时间是多少,那么(忽略“一天”开始时的瞬态效应 ) 该间隔时间的预期长度为 16 1/3。但如果我们首先选择到达间隔时间并想知道它的预期长度是多少,它是 15 分钟。

更新悖论还有其他变体,长度偏向抽样等,几乎相同。

示例 1)你有一堆灯泡,它们的寿命是随机的,但平均为 1000 小时。当一个灯泡出现故障时,它会立即被另一个灯泡替换。如果您选择一个时间进入有灯泡的房间,那么运行中的灯泡的平均寿命将超过 1000 小时。

示例 2)如果我们在给定时间去建筑工地,那么当时在那里工作的建筑工人从建筑物上掉下来的平均时间(从他们第一次开始工作时开始)大于工人的平均时间从所有开始工作的工人中下降(从他们第一次开始工作时开始)。为什么,因为直到脱落的平均时间较短的工人比平均水平更可能已经脱落(并且没有继续工作),因此正在工作的工人直到脱落的时间比平均时间长。

示例 3) 在一个城市中随机挑选一些人数不多的人,如果他们参加过该城市美国职业棒球大联盟棒球队的主场比赛(并非全部售罄),找出他们参加的比赛有多少人参加。然后(在一些稍微理想化但不是太不合理的假设下),这些比赛的平均上座率将高于球队所有主场比赛的平均上座率。为什么?因为参加高出席率比赛的人比参加低出席率比赛的人多,所以你更有可能选择参加过高出席率比赛的人而不是参加低出席率比赛的人。