我的朋友有可能猜出吃喝玩乐的味道

机器算法验证 可能性 假设检验 方差 期望值
2022-03-31 03:34:33

我正在准备数据科学面试,这是我在准备过程中遇到的一个问题:

你的朋友声称他可以仅凭味觉分辨五种颜色的吃喝玩乐。吃喝玩乐是任何特定颜色的概率是 1/5。你给你的朋友 3 个吃喝玩乐,他答对了 2 个。你应该相信他吗?如果你给他 100 分,他答对了 40 分怎么办?

我很确定答案是肯定的,在这两种情况下我都应该相信他们。这是我的推理:

Xi是一个指标随机变量,等于1如果我的朋友是正确的ith猜想E(Xi)=1/5Var(Xi)=4/25.

成功结果的预期数量为 3/5 和 20,三个猜测的方差为12/25,所以正确猜测两个比均值高出两个 SD,而方差100猜测是16,因此它们仅比平均值高出一个标准差。

我真的不确定我的推理是否正确,我将不胜感激。

1个回答

考虑第一种情况,三分之二是正确的:在您的朋友纯粹在猜测的零假设下,正确的数字是XBinom(n=3,p=1/5).对原假设的检验p>1/5拒绝大值X.所以结果的 P 值X=2P(X2)=0.104>0.05=5%你不会拒绝5%等级。证据并不要求你相信你的朋友可以通过味道识别颜色。[在 R 中进行以下计算,但使用二项式 PDF 将两项相加并不困难。 注意:如果你的朋友三个都猜对了,那么仅仅通过猜测的概率是(1/5)3=0.008应该被说服。]

sum(dbinom(2:3, 3, 1/5))
[1] 0.104

但是,如果您的朋友在 100 次中得到 40 次正确,则空分布为XBinom(n=100,p=1/5) P值是P(X40)0.因此,如果没有通过味道来判断颜色的能力,这种结果将是非常罕见的。你应该相信你的朋友有一些能力。

sum(dbinom(40:100, 40, 1/5))
[1] 1.099512e-28

通过正态近似Binom(n=100,p=1/5), 你有μ=E(X)=np=20, σ2=Var(X)=16, σ=SD(X)=4.然后

P(X40)=P(X>39.5)=P(Xμσ>39.5204=4.875)P(Z>4.875)0,
在哪里Z具有标准正态分布。

1 - pnorm(4.875)
[1] 5.440423e-07

在下图中,P 值是垂直虚线右侧的条形高度的(非常小的)总和。红色曲线显示了近似正态分布的密度函数。

在此处输入图像描述