囚徒悖论

机器算法验证 可能性 自习
2022-03-24 01:01:19

我有一个练习,我无法完全弄清楚。

囚徒悖论

三名被单独监禁的囚犯 A、B 和 C 在同一天被判处死刑,但由于是国定假日,州长决定赦免其中一人。囚犯们被告知了这一点,但被告知他们要等到预定的处决日才能知道其中哪一个可以幸免。

犯人 A 对狱卒说:“我已经知道另外两个犯人中至少有一个会被处决,所以如果你告诉我将被处决的人的名字,你就不会告诉我任何关于我自己被处决的信息。” .

狱卒接受了这一点,并告诉他C一定会死。

A 然后解释说:“在我知道 C 将被处决之前,我有三分之一的机会获得赦免。现在我知道无论是 B 还是我自己都会被赦免,几率已经提高到 2 分之一。”

但狱卒指出:“如果我说B会死,你可能会得出类似的结论,而我必须回答B或C,那你为什么要问呢?”。

A 获得赦免的机会有多大,为什么?构建一个可以让其他人相信你是对的解释。

你可以通过贝叶斯定理、绘制信念网络或常识来解决这个问题。无论您选择哪种方法,都应该加深您对条件概率这个看似简单的概念的理解。

以下是我的分析:

这看起来像蒙蒂霍尔问题,但不完全一样。如果 AI change my place with B在被告知 C 会死后说,他有 2/3 的机会得救。如果他不这样做,那么我会说他有 1/3 的机会活下去,就像你在蒙蒂霍尔问题中不改变你的选择一样。但同时,他在一组2人中,一个人应该死,所以很容易说他的机会是1/2。

所以悖论仍然存在,你将如何处理这个问题。另外,我不知道如何建立一个关于这个的信仰网络,所以我很想看看。

4个回答

最初有三种可能性相等的可能性:

  • A 将被释放(概率1/3)
  • B 将被释放(概率1/3)
  • C 将被释放(概率1/3)

有了消息的承诺,有四种不同概率的可能性:

  • A 将被释放,A 被告知 B 将被执行(概率1/6)
  • A 将被释放,A 被告知 C 将被执行(prob1/6)
  • B 将被释放,A 被告知 C 将被执行(概率1/3)
  • C 将被释放,A 被告知 B 将被执行(概率1/3)

以“A 被告知 C 将被执行”为条件,这变为

  • A 将被释放,A 被告知 C 将被执行(prob1/3)
  • B 将被释放,A 被告知 C 将被执行(概率2/3)

因此,在消息 A 想与 B 交换(蒙蒂霍尔问题)但不能,所以保留原来的2/3被执行的概率。

我认为您过度思考了这个问题 - 这是一个蒙蒂霍尔问题,同样的逻辑也适用。

我不太确定我是否同意@babelproofreader 的观点,即这是一个蒙蒂霍尔问题,同样的逻辑也适用。在蒙蒂霍尔问题中,你下去选择一扇门。规则是,Monty 知道奖品在哪里,永远不会打开隐藏奖品的门,并且总是会打开其中一扇未选择的门(即,如果您选择了没有奖品的门,他将不会打开您拥有的门选择并说,“对不起,你输了!”然后把你送回你的座位),他总是会提供切换到另一扇(未选择的未打开的)门的选择(即只有当你选择了他才会提供选择有奖品的门。)在这种情况下,如果A表示您最初选择的事件是有奖品的门,然后P(A)=13. 如果B如果您的最终选择是带奖品的门,那么

  • 如果您的策略是始终保持原状,那么P(BA)=1(因为你一开始就做出了正确的选择并坚持下去)和 P(BAc)=0(因为你一开始就做出了错误的选择并坚持下去)。所以根据全概率定律,
    P(B)=P(BA)P(A)+P(BAc)P(Ac)=1×13+0×23=13
  • 如果你的策略是总是切换,那么P(BA)=0(因为您一开始就做出了正确的选择,然后又切换了)和 P(BAc)=1(因为你一开始就做出了错误的选择,所以剩下的(未选择的未打开的)门保证有奖品)。所以根据全概率定律,
    P(B)=P(BA)P(A)+P(BAc)P(Ac)=0×13+1×23=23

在这里,情况有所不同。没有地方B如“如果 A 在被告知 C 将死后说我和 B 换了位置,那么他有 2/3 的机会得救。”

补充说明:另一个不同之处是,A 不知道狱卒是否知道谁将被赦免,或者狱卒说 C 将被处决时是否说真话。另一方面,狱卒说他告诉 A 将执行 C 并没有向 A 传达任何有用的信息是完全正确的。未选择的门露出一只山羊并对A说“打开你的门,让我们看看得到了什么”,也就是说,没有提供开关。所以 A 赢得奖品(蒙蒂霍尔)或被赦免(囚犯问题)的机会是相同的:1在......之外3 不管蒙蒂是否打开一扇未选择的门来暴露一只山羊,或者狱卒告诉 A 将被处决,或者不,正如亨利详细计算的那样。

答案取决于狱卒在知道要赦免 A 时如何选择要命名的囚犯。考虑两个规则:

1) 狱卒在 B 和 C 中随机选择,在这种情况下正好说 C。那么A被赦免的几率是1/3。

2) 狱卒总是说 C。那么 A 被赦免的机会是 1/2。

我们只知道狱卒说的是 C,所以我们不知道他遵循了哪些规则。事实上,可能还有其他规则——也许狱卒掷骰子,只有在掷出 6 时才说 C。