掷骰子直到它落在 4 以外的任何数字上。结果大于 4 的概率是多少?

机器算法验证 可能性 骰子
2022-01-27 04:22:32

给玩家一个公平的六面骰子。要获胜,她必须掷出大于 4 的数字(即 5 或 6)。如果她掷出 4,她必须再掷一次。她获胜的几率是多少?

我认为获胜的概率P(W), 可以递归表示为:

P(W)=P(r=5r=6)+P(r=4)P(W)

我已经近似P(W)作为0.3999通过在 Java 中运行 100 万次试验,如下所示:

import java.util.Random;
public class Dice {

    public static void main(String[] args) {
        int runs = 1000000000;
        int wins = 0;
        for (int i = 0; i < runs; i++) {
            wins += playGame();
        }
        System.out.println(wins / (double)runs);
    }

    static Random r = new Random();

    private static int playGame() {
        int roll;
        while ((roll = r.nextInt(6) + 1) == 4);
        return (roll == 5 || roll == 6) ? 1 : 0;
    }
}

我看到一个可以扩展P(W)像这样:

P(W)=13+16(13+16(13+16))...

但是我不知道如何在不求助于这种近似的情况下解决这种类型的递归关系。是否可以?

4个回答

注意:这是对最初问题的回答,而不是重复出现的问题。

如果她掷出 4,则基本上不算数,因为下一次掷骰是独立的。换句话说,掷出 4 后的情况与她开始时相同。所以你可以忽略 4。那么可能重要的结果是 1-3 和 5-6。有 5 种不同的结果,其中 2 种获胜。所以答案是 2/5 = 0.4 = 40%。

只需使用代数解决它:

P(W)=26+16P(W)56P(W)=26P(W)=25.

dsaxton ( https://stats.stackexchange.com/a/232107/90759 ) 和 GeoMatt22 ( https://stats.stackexchange.com/a/232107/90759 ) 的答案给出了解决问题的最佳方法。另一个是意识到你的表情

P(W)=13+16(13+16())

真的是几何级数

13+1613+16213+

一般来说,我们有

n=0a0qn=a01q

所以在这里我们有

P(W)=13116=13:56=615=25.

当然,证明几何级数和的一般公式的方法是使用类似于 dsaxton 的代数解。

上面所有的答案都是正确的,但他们没有解释为什么他们是正确的,以及为什么你可以忽略这么多细节,避免不得不解决复杂的递归关系。

其他答案正确的原因强马尔可夫属性,对于离散马尔可夫链,它等价于常规马尔可夫属性。https://en.wikipedia.org/wiki/Markov_property#Strong_Markov_property

基本上这个想法是随机变量

τ:=(直到骰子第一次没有落在 4 上的次数)

是一个停止时间https://en.wikipedia.org/wiki/Stopping_time停止时间是一个随机变量,它不依赖于任何未来信息

为了判断是否n骰子的第一个骰子是第一个没有落在 4 上的骰子(即为了决定是否τ=n),您只需要知道当前掷骰的值,以及所有先前掷骰的值,而不是任何未来掷骰的值——因此τ是一个停止时间,强马尔可夫性质适用。

强马尔可夫属性说明了什么?它说骰子落在的数字τ滚动,作为随机变量,Xτ,与之前所有卷的值无关

所以如果骰子掷出 4 一次,两次,...,5000 万次,...,τ1最终登陆另一个值之前的时间τ滚动,它不会影响事件发生的概率Xτ>4.

P(Xτ>4|τ=1)=P(Xτ>4|τ=2)==P(Xτ>4|τ=50,000,000)=

因此,我们可以假设,不失一般性,τ=1. 这只是骰子落在大于 4 的概率,因为它没有落在 4 上,我们可以很容易地计算出来:

P(X1>4|X4)=P(X1>4X14)P(X14)=P(X1>4)P(X14)=1356=1365=25
这当然是正确的答案。

您可以在 Durrett's Probability Theory and Examples(第 4 版)第 8.3 节中阅读有关停止时间和强马尔可夫属性的更多信息,p。365.