这是一个源于现实生活中的问题,对此我一直对它的答案感到困惑。
我儿子将在伦敦上小学。由于我们是意大利人,我很想知道有多少意大利孩子已经在学校上学。我在申请时向招生官询问了这个问题,她告诉我他们平均每班有 2 个意大利孩子(30 个)。
我现在处于我知道我的孩子已被录取的时间点,但我没有关于其他孩子的其他信息。录取标准是基于距离的,但就这个问题而言,我相信我们可以假设它是基于大量申请人样本的随机分配。
我儿子的班级预计会有多少意大利孩子?会更接近2还是3?
这是一个源于现实生活中的问题,对此我一直对它的答案感到困惑。
我儿子将在伦敦上小学。由于我们是意大利人,我很想知道有多少意大利孩子已经在学校上学。我在申请时向招生官询问了这个问题,她告诉我他们平均每班有 2 个意大利孩子(30 个)。
我现在处于我知道我的孩子已被录取的时间点,但我没有关于其他孩子的其他信息。录取标准是基于距离的,但就这个问题而言,我相信我们可以假设它是基于大量申请人样本的随机分配。
我儿子的班级预计会有多少意大利孩子?会更接近2还是3?
与往常一样,您需要考虑一个描述学校如何在班级之间分配孩子的概率模型。可能性:
所有这些都是合理的。鉴于策略 2,您的问题的答案是否定的。当他们使用策略 3 时,期望值会接近 3,但会小一些。那是因为您的儿子占据了“位置”,而您获得随机意大利人的机会就少了。
当学校使用策略 1 时,期望值也会上升;多少取决于每个班级的外国公民人数。
如果不了解您的学校,就无法更完美地回答这个问题。如果你每年只有一门课并且录取标准如前所述,那么答案将与上述 3 门相同。
详细计算3:
X 是班级中意大利儿童的人数。1 来自已知的孩子,29 是班上的其他人,2/30 是根据学校的说法,一个不知名的孩子是意大利人的概率。B 是二项分布。
请注意,从没有给出正确的答案,因为知道一个特定的孩子是意大利人违反了二项分布假设的可交换性。将此与男孩或女孩悖论进行比较,您是否知道一个孩子是女孩与知道大孩子是女孩是有区别的。
另一种看待这种情况的方式是在个别孩子的水平上。假设从一个人口中随机抽取 30 个孩子(您已经表明我们可以),我们可以向后推算从这个人口中抽取一个意大利孩子的粗略概率:=.
鉴于我们知道这 30 个孩子中有一个是意大利人,我们只需要计算剩余孩子的概率:
因此,知道您的孩子是意大利人后,班级中意大利孩子的预期人数会更改为大约 2.933,这比 2 更接近 3。
以下是我对如何解决此问题的想法:
让随机变量表示当前班级中意大利儿童的人数. 让成为一个新孩子是意大利人的指标。假设我们添加孩子到这堂课。那么这个规模扩大的班级中意大利儿童的预期数量是. 请注意,这里的独立性并不重要,因为我们只使用期望的线性。如果孩子当时被认为是意大利人概率为 1,因此我们将期望值增加了 1。
根据招生办公室的信息,意大利儿童的数量遵循二项式,假设独立。现在你知道在你的班上,至少有一个意大利孩子,所以期望变成了. 为了, 这计算为(如果我的计算正确)。
编辑。预期评估:
(注意最后一步总和下限的变化)