这个针对圣彼得堡悖论的拟议解决方案有什么问题?

机器算法验证 可能性 期望值 悖论 赌博
2022-03-12 10:31:31

我们有一个游戏,您的支出为,其中是您掷硬币正面朝上的次数(如果您的第一次掷硬币是正面,则)。那么预期收益为:2kkk=1

E=12(2)+14(4)+18(8)+...
E=1+1+1+...
E=

我应该花多少钱来玩这个游戏?

好吧,我们从几何分布中知道,在得到正面之前我将翻转的预期硬币数量是:

1P(HEAD)=1.5=2

所以我会用支付任何少于的费用:2kk=2

即<4美元

https://en.wikipedia.org/wiki/St._Petersburg_paradox供参考

3个回答
  • 是一些随机变量。K

    • 在您的问题中,是您在获得正面之前翻转的次数。K
  • 为某个支付函数。f(k)

    • 在您的问题中f(k)=2k
  • 为收益f(K)

您是说赌博的合理估值由给出。这是一个完全临时的、相当无原则的启发式方法。在某些情况下可能很好(例如,很小且接近线性),但很容易构建一个暗示一些无意义的例子。f(K)f(E[K])Kf

您的系统完全没有意义的示例

为正态分布的抽取,并令支付函数为你的系统说我不应该为这场赌博支付超过的费用,因为但是你不应该为这场赌博分配一些积极的价值吗?!回报大于零的概率为 100%!KN(0,10000000000000)f(K)=K20f(E[K])=02=0

圣彼得堡悖论的更经典解决方案

一种方法是增加风险规避。如果你足够规避风险,那么你愿意为这个无限期望赌博付出的代价将是有限的。如果您接受冯诺依曼-摩根斯特恩公理,则玩游戏的确定性给出,其中:z

u(w+z)=E[u(w+f(K))]

其中是你的财富,是一个凹函数(用行话来说,是伯努利效用函数),它反映了你的风险厌恶程度。如果足够凹,则的估值将是有限的。wuu2K

具有一些不错属性的伯努利效用函数结果是在伯努利效用函数是您财富的对数的情况下,最大化预期效用等同于最大化您的财富的预期增长率。对于简单的二元投注,这为您提供了凯利标准投注。u(x)=log(x)

另一个重要的一点是,风险规避方法会导致不同的确定性等价物,具体取决于您在赌博的哪一边。

该提议的决议没有任何问题。

在最初的悖论中,我们着眼于利润的预期值(平均值),它是无限的,因此您应该下注无限量。然而,在第一次抛硬币后,你有 50% 的机会赔钱,这就是人们不喜欢它的原因。您的决议只是形式化了这一点,而不是查看平均利润,而是查看中位数利润。与平均利润不同,利润中位数是有限的,悖论消失了。

如果我理解正确,您的分析是:

  1. 计算获得正面所需的预期掷硬币次数。
  2. 计算您获得预期数字的结果的支出。
  3. 将游戏价值等同于该支出。

...好吧,让我们稍微修改一下那个游戏。就像最初的版本一样,我会掷硬币并不断掷硬币,直到出现正面。只有支出发生了变化:

  • 如果我在第二次投掷时正面朝上,你会得到四美元。
  • 任何其他结果中,您将失去您拥有的一切,并且必须永远免费为我工作。

在我们得到正面之前,我们期望翻转多少硬币?2、和以前一模一样。

我们掷两个硬币得到正面的结果是什么?4.00 美元,和以前完全一样。

你愿意为支付这个有 75% 的可能性让你破产并有 25% 的机会返回 4.00 美元的游戏的“特权”支付多少?

我怀疑答案不是“最多四美元,和以前完全一样”。这意味着您的逻辑存在漏洞。

从更广泛的角度来看,预期的奖金不一定足以回答这类问题;通常它取决于一些额外的上下文。这是一次性的机会,还是您希望多次获得这种赌博?你手头有多少钱?你需要多少钱才能快乐?

例如,如果我的总财富是 100 美元,但我急需 100 万美元用于挽救生命的手术,我愿意为圣彼得堡的赌注付出所有的钱。它只给了我 1/2^19 的机会赢得我需要的钱,但如果我不玩,我根本没有机会。

另一方面,如果我的总财富是 1000,000 美元,而我恰好需要 100 万美元来进行这项操作,那么我最愿意为一场游戏支付 2 美元(我保证会赢回来) . 还有更多,我有 1/2 的机会最终无法挽救我的生命所需的一百万美元。

如果我期望有很多机会玩这类游戏,那么我可能想选择一种策略,让我在所有这些游戏结束时有很高的概率获得大量资金。例如:

游戏A保证每次我玩它都会增加我10%的财富。(预期获胜:+10% 我目前的财富。) 游戏 B 有 90% 的机会让我的财富翻倍,有 10% 的机会让我破产。(预期获胜:+70% 我目前的财富。)[编辑:实际上 +80%,因为我基本算术不及格,但这个论点仍然成立。]

如果我玩游戏 A 的 100 次迭代,我的财富肯定会乘以 13,780 倍。

如果我玩游戏 B 的 100 次迭代,我有 0.0027% 的机会变得难以想象的富有(大约是我开始时的 10^30 倍)……以及 99.73% 的机会破产。尽管平均值比游戏 A 好,但这不是一个好的选择。

对于这种重度迭代的游戏,与其试图最大化我在每场游戏中的预期赢利,不如尝试最大化 ln 的预期值(游戏后的总财富/游戏前的总财富)。这确保了长期增长而不会被消灭。

如果每场比赛的赌注相对于我的总财富来说很小,那么这大约相当于最大化每场比赛的预期赢利。

因此,如果您玩很多游戏并且从未冒过您当前财富的大部分风险,那么赌博的预期价值会告诉您您需要知道的一切。在几乎任何其他情况下,您也需要考虑其他事情。