正如 Glen_b 所指出的,如果公交车每 15 美元一分钟到达,没有任何不确定性,我们知道最长可能的等待时间是 15 美元分钟。如果我们“随机”到达,我们觉得“平均而言”我们将等待最大可能等待时间的一半。并且最大可能的等待时间在这里等于两个连续到达之间的最大可能长度。表示我们的等待时间 $W$ 和两个连续公交车到达之间的最大长度 $R$,我们认为
$$ E(W) = \frac 12 R = \frac {15}{2} = 7.5 \tag{1}$$
我们是对的。
但是突然间我们失去了确定性,我们被告知现在 15 美元的分钟是两辆公共汽车到达之间的平均时间。而我们陷入“直觉思维陷阱”,认为:“我们只需要将$R$替换为它的期望值”,我们争论不休
$$ E(W) = \frac 12 E(R) = \frac {15}{2} = 7.5\;\;\; \text{错误} \tag{2}$$
我们错了的第一个迹象是 $R$不是“任何两个连续的公共汽车到达之间的长度”,它是“最大长度等”。所以无论如何,我们有$E(R) \neq 15$。
我们是如何得出方程 $(1)$ 的?我们认为:“等待时间最多可以从 $0$ 到 $15$ 。我在任何情况下都以相同的概率到达,所以我随机且以相同的概率“选择”所有可能的等待时间。因此,两个连续公交车到达之间的最大长度的一半是我的平均等待时间”。我们是对的。
但是通过错误地在方程 $(2)$ 中插入值 $15$,它不再反映我们的行为。用 $15$ 代替 $E(R)$,方程 $(2)$ 表示“我随机选择所有可能的等待时间,这些等待时间小于或等于两个连续公交车到达之间的平均长度” - 并且这就是我们的直觉错误所在,因为我们的行为并没有改变——所以,通过均匀随机到达,我们实际上仍然“随机且以相等的概率选择”所有可能的等待时间——但没有捕捉到“所有可能的等待时间”减少 15 美元 - 我们忘记了两个连续巴士到达之间长度分布的右尾。
所以也许,我们应该计算任意两个连续公交车到站之间的最大长度的期望值,这是正确的解决方案吗?
是的,它可能是,但是:特定的“悖论”与特定的随机假设密切相关:公交车到达是由基准泊松过程建模的,这意味着因此我们假设之间的时间长度任何两个连续的公共汽车到达都遵循指数分布。用 $\ell$ 表示那个长度,我们有
$$f_{\ell}(\ell) = \lambda e^{-\lambda \ell},\;\; λ = 1/15,\;\; E(\ell) = 15$$
这当然是近似的,因为指数分布有来自右边的无限支持,这意味着严格来说“所有可能的等待时间”包括,在这个建模假设下,更大和更大的量级达到并“包括”无穷大,但概率为零.
但是等等,指数是无记忆的:无论我们将在什么时间点到达,我们都会面对相同的随机变量,无论之前发生了什么。
鉴于这种随机/分布假设,任何时间点都是“两个连续公交车到达之间的间隔”的一部分,其长度由相同的概率分布描述,期望值(不是最大值)$15$:“我在这里,我我被两次巴士到达之间的间隔所包围。它的长度有些是过去的,有些是未来的,但我不知道有多少和多少,所以我能做的最好的就是问它的预期长度是多少-我的平均等待时间是多少?” - 答案总是“15 美元”,唉。