一家电子公司生产的设备在 95% 的时间内都能正常工作

机器算法验证 自习 二项分布 中心极限定理
2022-03-16 19:28:06

一家电子公司生产的设备在 95% 的时间内都能正常工作。新设备以每箱 400 个装运。公司希望保证每箱有 k 个或更多设备工作。使至少 95% 的盒子符合保修要求的最大 k 是多少?

尝试:我知道我应该使用中心极限定理来解决这个问题,但不确定设置中的 N 应该是多少,因为每个盒子中有 400 个设备并且盒子的数量是未知的。谁能给我一个关于设置的提示?谢谢!

2个回答

您必须假设任何盒子中的设备都是独立的。 在这种情况下,任何盒子中的工作设备的数量必须服从二项分布。参数为(箱内设备数量)和(工作速率)。400.95

假设您保证每个盒子工作您是说所有此类盒子中至少有 95% 包含个或更多工作设备。在随机变量和分布的语言中,您断言二项式变量等于或超过的机会至少为通过计算 = 第 5 个百分位可以找到解决方案。唯一微妙的部分是,由于这是一个离散分布,我们应该注意不要在我们的答案中脱颖而出。kk(400,0.95)k95%10095

R告诉我们第五个百分位是k=373

qbinom(.05, 400, .95)

373

让我们通过计算等于或超过此值的机会来检查:

pbinom(373-1, 400, .95, lower.tail=FALSE)

0.9520076

(至少对我来说,有点违反直觉的是,函数lower.tail=FALSE参数包括其参数的值。因此,计算与严格大于的结果相关的机会。)Rpbinompbinom(k,n,p,lower.tail=FALSE)k

作为仔细检查,让我们确认我们不能保证更大的值:

pbinom(373, 400, .95, lower.tail=FALSE)

0.9273511

因此,的阈值落在这两个连续概率之间。0.95

换句话说,我们发现

从长远来看,的盒子将包含或更多的工作设备,但只有的盒子将包含或更多的工作设备。因此,如果我们希望或更多的盒子符合这个标准,我们不应该保证超过95.2%k=37392.7%37437395%

顺便说一句,对于这个特定问题,正态分布是一个很好的近似值。(我不会显示你会得到的答案,而是让你来计算,因为你只要求提供有关如何设置问题的信息。)

此图将二项式分布函数与其近似正态概率进行比较。

数字

两者并不完全一致——但在附近,它们确实非常接近。k=373

“至少”从“至少 95%”表示“最小”。

代码:

#reproducible
set.seed(250048)

#how many times to check
N_repeats <- 500000

#stage for loop
temp <- numeric()

#loop
for (j in 1:N_repeats){

     #draw 400 samples at 95% rate
     y <- rbinom(n = 400,size = 1,prob = 0.95)

     #compute and store sampled rate
     temp[j] <- mean(y)

}

#print summary (includes min)
summary(temp)

结果:

> summary(temp)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
 0.8900  0.9425  0.9500  0.9500  0.9575  0.9925

当我看到这个时,我看到该比率的最小值是 89%。这意味着在 50 万次尝试中,最坏的情况是 89% 有效。

400 的 89% 是 356。这给出了大约 100%,而不是 95%。实际的 100% 可能低于此值。

#find the 95% case
quantile(temp,probs = 0.05)

产量:

> quantile(temp,probs = 0.05)
    5% 
0.9325 

400 的 93.25% 是 373。这不是数据的边缘,而是内部,所以它可能是一个很好的估计。您的答案将接近 373。