为了最大限度地提高正确猜测掷硬币结果的机会,我应该总是选择最可能的结果吗?

机器算法验证 可能性
2022-01-26 04:31:24

这不是家庭作业。我有兴趣了解我的逻辑对于这个简单的统计问题是否正确。

假设我有一个 2 面硬币,其中翻转正面的概率是并且翻转尾部的概率是让我们假设所有翻转都有独立的概率。现在,假设我想最大化预测硬币在下一次翻转时是正面还是反面的机会。如果,我可以随机猜测正面或反面,我正确的概率是P(H)1P(H)P(H)=0.50.5

现在,假设,如果我想最大化我正确猜测的机会,我应该总是猜测概率为的尾巴吗?P(H)=0.20.8

更进一步,如果我有一个 3 面骰子,并且掷出 1、2 或 3 的概率为,我应该总是猜 2 以最大限度地提高我猜对的机会吗?是否有另一种方法可以让我更准确地猜测?P(1)=0.1P(2)=0.5P(3)=0.4

3个回答

你是对的。如果,并且您使用的是零一损失(也就是说,您需要猜测实际结果而不是概率或其他东西,此外,当您猜测反面时得到正面与当你猜到正面时得到尾巴),你应该每次都猜到尾巴。P(H)=0.2

人们经常错误地认为答案是在随机选择的 80% 的试验中猜测反面,而在其余的试验中猜出正面。这种策略被称为“概率匹配”,并在行为决策中得到了广泛的研究。参见,例如,

West, RF 和 Stanovich, KE (2003)。概率匹配聪明吗?概率选择与认知能力之间的关联。记忆与认知,31,243-251。doi:10.3758/BF0​​3194383

您本质上是在问一个非常有趣的问题:我应该使用“MAP 贝叶斯”最大后验估计还是“真实贝叶斯”来预测。

假设您知道的真实分布,然后使用 MAP 估计,假设您想对接下来的 100 个翻转结果进行 100 个预测。你应该总是猜测翻转是尾巴,而不是猜测头和尾。这被称为“MAP贝叶斯”,基本上你在做P(H)=0.22080

argmaxθf(x|θ)

不难证明,这样做可以最小化预测误差(0-1 损失)。证明可以在Introduction to Statistical Learning第 53 页找到。


还有另一种称为“真实贝叶斯”方法的方法。基本上,您不是在尝试“选择概率最高的结果,而是从概率上考虑所有情况”因此,如果有人要求您“预测下 100 次”翻转,您应该暂停他/她,因为当您给出 100 个二元结果时,每个结果的概率信息都消失了。相反,你应该问,知道结果后你想做什么。

假设他/她有一些损失函数(0-1损失不是必须的,比如损失函数可以是,如果漏掉一个头部,需要支付$ 1,但是如果漏掉一个尾部,则需要支付$ 5,即不平衡损失),那么您应该使用您对结果分布的了解来最小化整个分布的损失

xyp(x,y)L(f(x),y)

,即,将您关于损失分布的知识结合起来,而不是“阶段性的方式”,得到预测并执行下一步。

更重要的是,当有许多可能的结果时,你对会发生什么有很好的直觉。如果结果数量很大且概率质量分布广泛,则 MAP 估计将无法正常工作。想想你有 100 个边骰,你就知道真实的分布。其中现在你用 MAP 做什么?你总是会猜测你得到了第一面,因为它与其他人相比具有最大的概率。但是你会在的时候出错!!P(S1)=0.1P(S2)=P(S3)=P(S100)=0.9/99=0.009090S190%

由于独立性,如果您猜测最可能的情况,您的期望值总是最大化。没有更好的策略,因为每次翻转/滚动都不会为您提供有关硬币/骰子的任何额外信息。

在任何你猜测不太可能的结果的地方,你对获胜的期望都比你猜测最可能的情况要少,因此你最好只猜测最可能的情况。

如果您想做到这一点,因此您确实需要在翻转时改变策略,您可能会考虑一个硬币/骰子,您最初不知道赔率,您必须在滚动时弄清楚它们。