抛硬币序列中的停止条件

机器算法验证 可能性
2022-04-02 08:15:53

想象一下,您最多可以掷硬币 X 次。如果在这个序列中,硬币连续 3 次落在反面,你就停下来。否则你就一直翻。

你重复这个游戏 N 次。

它的“现实世界”应用可能是篮球比赛中的射手。假设他最多可以投篮 X=25 次(即 25 次潜在 FGA),N=82(一个赛季的比赛)。他的教练告诉他如果连续投失 3 球就停止投篮。

我模拟了这个场景,发现停止条件不会影响硬币落头的整体概率。这对我来说似乎违反直觉,因为它“感觉”(我的直觉告诉我)停止条件会以某种方式使结果产生偏差。

有人可以向我解释为什么这里的停止条件不会影响这种情况下正面和反面的整体分布吗?

编辑:这似乎与“出生问题”不同,因为 p 的值无关紧要(即它不必是 1/2)。无论 p 的值如何,这种情况下的停止条件似乎对整体概率没有影响。从出生问题的答案中我不清楚为什么会这样。

2个回答

“成功”的概率(正面、投篮等)是成功次数与试验次数的极限比率。p

运行模拟的一种方法是生成一个非常长的独立二进制试验序列,其潜在成功概率为扫描整个序列,寻找停止序列是一次成功,或者在篮球问题中是连续三次失败)。每次出现结束后立即宣布新实验的开始。pSSS

例如,这里是这样一个序列的开始,其中表示成功和失败,其中设置为p=1/310S010

10010 010 0010 1010 10000011010 11110
    |   |    |    |           |     

刻度标记每个实验的终点。最后五个结果 ( 11110) 在这个简短的模拟中将被丢弃,因为它们所属的实验没有结束,剩下个独立的随机值,包括五个完整的实验。在这个值中,是成功的,比例(这与一致,但由于偶然性而有所不同)。27271010/27p=1/3=9/27

请注意,停止规则不会改变顺序:它只是标记连续实验之间的界限。

的最后一次出现后丢弃所有结果,但随着模拟的增长,这些被放弃的结果构成所有结果的任何可观比例的机会缩小到零。S

因此,您的模拟中的成功比例不能与长期独立结果序列中的成功比例有任何不同(在试验次数增加的极限内):它与的偏差不会超过机会允许的范围.p

我想到了一种直观的方式来解释这一点(并回答我自己的问题)。事实证明,如果您只是忽略停止并将这个问题视为串联序列的总和,那么很明显它并不重要。

想象一下,我们在 3 次连续未命中后停止了以下序列:

1 0 1 0 0 0
1 0 1 1 0 1 0 0 0
0 0 0
1 0 0 0

现在,您可以看到,如果您只是将这些序列串联起来,那么 1 和 0 的整体比例是一样的,就像您在同一个序列中翻转所有一样。“停止”根本不重要。这只是序列中的一个心理中断。

1 0 1 0 0 0 1 0 1 1 0 1 0 0 0 0 0 0 1 0 0 0

那里有相同数量的 1 和 0。停止条件是红鲱鱼。