如果我们修改“有史以来的最佳统计问题”,正确的答案是什么?

机器算法验证 可能性 悖论
2022-03-28 04:15:11

有一个流行的问题,称为“有史以来最好的统计问题”。

如果你随机选择这个问题的答案,你答对的机会有多大?

A) 25% B) 50% C) 60% D) 25%

这个任务不是很困难,正确答案是0%。但是如果我们这样修改它:

如果你随机选择这个问题的答案,你答对的机会有多大?

A) 50% B) 25% C) 60% D) 50%

正确的答案是什么?我们是否有两个正确答案:25% 和 50%,或者没有正确答案,因为有了这两个正确答案,选择正确答案的机会实际上是 75%(但我们没有写在桌子上的 75% )?

顺便一提。答案 0% 是否仍然是正确答案,在这种情况下是第三个正确答案?

4个回答

通过清晰而仔细地提出问题,可以解决明显的(逻辑或概率)悖论。

以下分析的动机是捍卫答案的想法:当应试者可以表现出他们的答案确实正确的可能状态(与所有可用信息一致)时,则应将其标记为正确。等效地,当不存在这样的辩护时,答案是不正确的;否则被认为是正确的。这模拟了(仁慈的、理性的)评分者和(理性的)应试者之间的通常互动:-)。通过对第二个问题展示多种此类辩护来解决明显的悖论,其中只有一种可以适用于任何情况。


我将在传统意义上理解这些问题中“随机”的含义:为了模拟一个随机选择的答案,我会将每个答案写在一张纸条(“票”)上并放在一个盒子里:那将是一共四张票。从盒子里抽出一张票(在仔细和盲目地洗牌后)是“随机”选择的物理模型它激发并证明了相应的概率模型。

现在,“正确”是什么意思?在我的无知中,我会探索所有的可能性。无论如何,我认为零张、一张甚至更多张票可能是“正确的”。(我怎么知道?我只是查阅评分表!)我将通过在每张正确的票上来标记“正确”答案。这是例行公事,不应该引起争议。10

需要注意的一个明显但重要的事情是,写的规则必须完全基于每张票上写的答案:从数学上讲,它是一个映射(或重新分配)发送一组列出的答案(在两个问题中)进入集合这条规则是自洽所必需的。01{.25,.50,.60}{0,1}

让我们转向问题的概率元素:根据定义,在随机抽奖的情况下,正确的机会是对它们标记的值的期望。期望是通过将票上的值相加并除以它们的总数来计算的。因此它将是0.25.50.751

如果只有答案等于期望的票被标记为 s ,那么标记将是有意义的。这也是一个自洽的要求。我声称这是问题的症结所在:找到并解释有意义的标记。如果没有,那么问题本身可以被标记为毫无意义。它有一个独特的标记,那么就不会有争议。只有当两个或更多标记有意义时,才会有任何潜在的困难。1

哪些标记有意义?

我们甚至不需要进行详尽的搜索。 在第一个问题中,门票上列出的期望是 25%、50% 和 60%。后者是不可能的四张票。第一个需要标记一张票;第二,两张票。这最多提供可能的标记来探索。唯一有意义的标记将放在每张票上。对于这个标记,期望是这证明了对第一个问题的陈述答案是正确的。(可以说,对第一个问题的唯一正确答案是不选择任何答案!)3+3=60(0+0+0+0)/4=0

在第二个问题中,出现了相同的答案,并且再次有六个标记可供探索。这一次,三个标记是自洽的。我将它们制成表格:

Solution 1                Solution 2                Solution 3
Ticket Answer Mark        Ticket Answer Mark        Ticket Answer Mark
     A    50%    1             A    50%    0             A    50%    0
     B    25%    0             B    25%    1             B    25%    0
     C    60%    0             C    60%    0             C    60%    0
     D    50%    1             D    50%    0             D    50%    0

因此,在第二个问题中,“正确”有三种不同的可能定义,导致 A 或 D 正确(在解决方案 1 中)或只有 B 正确(在解决方案 2 中),或者没有一个答案是正确的(在解决方案3)。

解释这种情况的一种方法是,对于每个答案 A、B 和 D,至少存在一种标记票证的方法,以使这些答案正确。 这并不意味着所有三个都是同时正确的:它们不可能是,因为如果您是考试的评分者,那么如果您将 A、B 或 D 中的任何一项标记为正确,那么您将不会从应试者那里得到争论;但是,如果您将其中任何一个标记为不正确,.25.50考生将有正当理由对你的评分提出异议:他们会援引解决方案 1 或解决方案 2。事实上,如果考生拒绝回答问题,解决方案 3 将为他们提供正当理由辩称他们的非-响应也应该得到充分的信任!

总而言之,该分析通过得出以下结论解决了问题的第二部分:对问题 2 的以下任何回答都应标记为正确,因为它们中的每一个都是可以辩护的:A、B、D、A 和 D,什么都没有。没有其他回应可以辩护,因此不会是正确的。

我认为除了概率之外,这里还有一个语义问题。随机选择很清楚。A、B、C 和 D 中的每一个将被选中 25%。但是,当您随机选择时,正确意味着什么?似乎这应该意味着假设您选择 A 确实作为答案给出了正确的样本百分比,这些样本对于 B、C 和 D 来说都是正确的和相同的。所以您必须为每个正确答案计算 1/4 并求和所有正确的答案以获得正确的百分比。但这导致了一个循环论证。因此出现了悖论。这似乎真的是一个逻辑问题,而不是概率或统计问题。

whuber在允许多个答案的情况下给出了很好的分析。然而,也有一种一致的方式来理解这个问题,这样只有一个正确的答案(尽管我们需要将其作为问题的一部分来说明):

如果您随机选择这个问题的答案,那么在只有一个正确答案的情况下,您正确的机会是多少?

A) 50% B) 25% C) 60% D) 50%

再次,我们将定义一个“正确”的答案为一个合理的辩护,并将遵循 whuber 的论点。标记是对的一组答案的映射,正确答案发送到 1,错误答案发送到 0。有三种可能的自洽标记:{0,1}

Solution 1                Solution 2                Solution 3
Ticket Answer Mark        Ticket Answer Mark        Ticket Answer Mark
     A    50%    1             A    50%    0             A    50%    0
     B    25%    0             B    25%    1             B    25%    0
     C    60%    0             C    60%    0             C    60%    0
     D    50%    1             D    50%    0             D    50%    0

然而,我们需要另一个合乎逻辑的步骤来将这些范围缩小到一个可辩护的答案。在做这个问题时,老师面临着三个可能的标记,每一个都可以和其他的一样是一个可以接受的单一答案。然而,由于只有一个答案是正确的,教师应该在它们之间随机选择。这为每个标记分配了相等的概率,因此:

  • 1/3的时间学生是正确的的时间是正确的50%
  • 1/3的时间学生将是正确的的时间25%
  • 1/3的时间学生是正确的的时间0%

这导致期望学生在 % 的时间里是正确的。因此 25% 应该是正确答案并且应该选择解决方案 2 的标记。这是教师在三个可能的标记上的先验的自洽更新,即如果解决方案 2 固定为 100% 的正确标记,那么 25% 仍然是一个正确答案。(50+25+0)/3=25

摘要:如果我们指定只有一个正确答案,那么该答案为 25%。

我相信答案是 1/3。我们不知道哪个答案(25%、50% 或 60%)是正确的。因此,如果选择每个答案,25%、50% 和 60% 都有 1/3 的机会是正确的。即使 25% 出现两次,它仍然有 1/3 的机会成为正确答案。实际上,25% 作为答案出现多少次并不重要。如果它与 50% 和 60% 一起出现 10 次,它是正确答案的机会仍然是 1/3。这假设其中一个答案是正确的。如果没有一个答案是正确的,那么答案将是 1/4。这是基于我对问题所问内容的解释。