如果我在我的工厂生产了 1000 个小部件,并且我想知道它们都没有缺陷,那么我必须抽样多少个才能期望在 95% CL 时在全部 1000 个中没有缺陷。
您必须对没有负数的样本进行抽样才能得出总体中没有负数的结论?
假设我们希望在 95% 的置信水平上没有缺陷小部件。这意味着我们必须测试足够多的小部件,如果存在有缺陷的小部件,那么我们将有 95% 的机会在测试中找到有缺陷的小部件。
当然,如果我们希望有 95% 的机会找到有缺陷的小部件,这意味着我们必须测试 95% 的所有小部件。因此,不幸的是,答案是您必须测试 1,000 个小部件中的 950 个。
就是这样,这就是你问题的全部答案。但是让我谈谈实际的考虑,因为在实践中,实际上没有任何情况需要测试 95% 的小部件。
场景 1:您正在构建一个包含 1,000 个链接的链。出于某种原因,您决定从不同的人那里购买每个链接,因此您有 1,000 个不同的人向您提供链链接。为了使链条坚固,所有链接都必须坚固;哪怕只有一个薄弱环节也是不可接受的。
在这种情况下,问题在于测试某些链接并不能告诉您有关剩余链接的任何信息。即使您测试了其中的 999 个,您仍然对剩余的链接一无所知。因此,仅测试(比如说)750 个链接绝对是不够的。
正如我所提到的,为了在 95% 的置信水平下得出结论,没有一个链接是弱的,您需要测试其中的 950 个。此时,您可能想知道,“我为什么要停在 950?为什么不直接测试所有 1,000 个?” 答案是你是绝对正确的。您可能应该只测试所有 1,000 个链接,这样您就知道它们都很强大。
场景 2:您有一台制造链节的机器,并且您刚刚使用该机器制作了一批 1,000 个链节。如上所述,所有链接都必须坚固才能使链条坚固。您应该测试多少个链节才能确保您拥有坚固的链条?
如果您在现实世界中遇到这种情况,那么您应该尝试找出有关机器的更多信息。最好的情况是有两种类型的机器:一种只产生强链接,另一种只产生弱链接。在这种情况下,您只需要测试一个链接就可以知道所有链接都很强!
也许更现实的情况是,一些机器只产生强链接,而另一些机器产生 50% 的强链接和 50% 的弱链接。在这种情况下,为了达到 95% 的置信度,您只需要测试 5 个链接并查看它们都很强。
另一个有趣的案例是这些机器非常可靠,其中 99.9% 只产生强链接。在这种情况下,如果这台机器是从所有机器中随机选择的,那么您无需测试任何链接即可达到所有链接都强的 95% 置信水平。
当然,我无法描述所有可能的实际情况,但希望这能让您了解为什么 950 是原始问题的正确答案,以及为什么该答案在实践中不太可能非常有用。
正如维基百科链接中所解释的那样,“三法则”适用于(二项式)采样替换或从理论无限分布中采样。我怀疑这条规则是否适用于你的问题。
当然,要 100% 确定您的 1000 个小部件中的任何一个都没有缺陷,您必须查看所有这些小部件。
如果 1000 个中有一个有缺陷的小部件,那么通过查看 750 个随机选择的小部件找到它的机会只有 超几何概率。在 R 中,
dhyper(1, 1, 999, 750)
[1] 0.75
如果您想在 1000 个中找到 95% 的缺陷,则需要对 950 个小部件进行抽样(无需更换)。
dhyper(1, 1, 999, 950)
[1] 0.95
如果 1000 个中有两个或多个缺陷品,那么(几乎)看 750 个就足够了。
sum(dhyper(1:2, 2, 998, 750))
[1] 0.9376877
sum(dhyper(1:2, 2, 998, 775))
[1] 0.9495495
sum(dhyper(1:2, 2, 998, 777))
[1] 0.9504444
早在 4 月,我就查看了这个问题的一个版本,看看我们可以根据合理数量的测试对消除 Covid 说些什么(剧透:不是很多)。
正如@keith 的回答所示,如果您想确保总体中没有一个失败,您需要对大部分总体进行抽样。在大多数情况下,这显然是不明智的。
正如@BruceET 在他的评论中所说,贝叶斯解决方案是有道理的。但是,因为数据中很少有关于人口中极少数故障的信息
- 重要的是您之前进行的失败次数很少
- 如果您先验地认为小数字是合理的,并且不对大部分人口进行抽样,那么您将不可避免地仍然认为是后验的,因此您最终不会得到高后验概率为零
假设您先采用作为失败概率。中没有失败后的后验是。因此,您可以查看该分布的分位数,并查看它何时集中到足够接近零以用于您想要的用途。
三法则规定,如果我对 N 进行抽样,那么我知道在 95% CL 时我的比率小于 3/N
我的期望值 E 是我的速率乘以总事件数 T。
E = T*3/N
剩余的总事件只是未采样的数量 T=1000-N
E = (1000-N)*3/N
我最多期望 1 所以 E=1
求解 N 给出
N = 1000 3/(1+3) = 1000 3/4 = 750
采样 3/4 似乎很多,所以我有一些疑问,但这是一个非常严格的要求。
也可以给出任何置信度的一般情况,其中多人游戏为 -ln(α),α 为 1 减去置信度。
对于人口规模 P,一般情况是
N = P*ln(α)/(ln(α)-E)