一家电子公司生产的设备在 95% 的时间内都能正常工作。新设备以每箱 400 个装运。公司希望保证每箱有 k 个或更多设备工作。使至少 95% 的盒子符合保修要求的最大 k 是多少?
尝试:我知道我应该使用中心极限定理来解决这个问题,但不确定设置中的 N 应该是多少,因为每个盒子中有 400 个设备并且盒子的数量是未知的。谁能给我一个关于设置的提示?谢谢!
一家电子公司生产的设备在 95% 的时间内都能正常工作。新设备以每箱 400 个装运。公司希望保证每箱有 k 个或更多设备工作。使至少 95% 的盒子符合保修要求的最大 k 是多少?
尝试:我知道我应该使用中心极限定理来解决这个问题,但不确定设置中的 N 应该是多少,因为每个盒子中有 400 个设备并且盒子的数量是未知的。谁能给我一个关于设置的提示?谢谢!
您必须假设任何盒子中的设备都是独立的。 在这种情况下,任何盒子中的工作设备的数量必须服从二项分布。参数为(箱内设备数量)和(工作速率)。
假设您保证每个盒子工作您是说所有此类盒子中至少有 95% 包含个或更多工作设备。在随机变量和分布的语言中,您断言二项式变量等于或超过的机会至少为。通过计算 = 第 5 个百分位可以找到解决方案。唯一微妙的部分是,由于这是一个离散分布,我们应该注意不要在我们的答案中脱颖而出。
R告诉我们第五个百分位是:
qbinom(.05, 400, .95)
373
让我们通过计算等于或超过此值的机会来检查:
pbinom(373-1, 400, .95, lower.tail=FALSE)
0.9520076
(至少对我来说,有点违反直觉的是,函数的lower.tail=FALSE参数不包括其参数的值。因此,计算与严格大于的结果相关的机会。)Rpbinompbinom(k,n,p,lower.tail=FALSE)k
作为仔细检查,让我们确认我们不能保证更大的值:
pbinom(373, 400, .95, lower.tail=FALSE)
0.9273511
因此,的阈值落在这两个连续概率之间。
换句话说,我们发现
从长远来看,的盒子将包含或更多的工作设备,但只有的盒子将包含或更多的工作设备。因此,如果我们希望或更多的盒子符合这个标准,我们不应该保证超过
顺便说一句,对于这个特定问题,正态分布是一个很好的近似值。(我不会显示你会得到的答案,而是让你来计算,因为你只要求提供有关如何设置问题的信息。)
此图将二项式分布函数与其近似正态概率进行比较。
两者并不完全一致——但在附近,它们确实非常接近。
“至少”从“至少 95%”表示“最小”。
代码:
#reproducible
set.seed(250048)
#how many times to check
N_repeats <- 500000
#stage for loop
temp <- numeric()
#loop
for (j in 1:N_repeats){
#draw 400 samples at 95% rate
y <- rbinom(n = 400,size = 1,prob = 0.95)
#compute and store sampled rate
temp[j] <- mean(y)
}
#print summary (includes min)
summary(temp)
结果:
> summary(temp)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.8900 0.9425 0.9500 0.9500 0.9575 0.9925
当我看到这个时,我看到该比率的最小值是 89%。这意味着在 50 万次尝试中,最坏的情况是 89% 有效。
400 的 89% 是 356。这给出了大约 100%,而不是 95%。实际的 100% 可能低于此值。
#find the 95% case
quantile(temp,probs = 0.05)
产量:
> quantile(temp,probs = 0.05)
5%
0.9325
400 的 93.25% 是 373。这不是数据的边缘,而是内部,所以它可能是一个很好的估计。您的答案将接近 373。