机器算法验证 - 您必须对没有负数的样本进行抽样才能得出总体中没有负数的结论？ - 吾爱随笔录

机器算法验证可能性采样二项分布

2022-04-03 10:06:29

如果我在我的工厂生产了 1000 个小部件，并且我想知道它们都没有缺陷，那么我必须抽样多少个才能期望在 95% CL 时在全部 1000 个中没有缺陷。

4个回答

假设我们希望在 95% 的置信水平上没有缺陷小部件。这意味着我们必须测试足够多的小部件，如果存在有缺陷的小部件，那么我们将有 95% 的机会在测试中找到有缺陷的小部件。

当然，如果我们希望有 95% 的机会找到有缺陷的小部件，这意味着我们必须测试 95% 的所有小部件。因此，不幸的是，答案是您必须测试 1,000 个小部件中的 950 个。

就是这样，这就是你问题的全部答案。但是让我谈谈实际的考虑，因为在实践中，实际上没有任何情况需要测试 95% 的小部件。

场景 1：您正在构建一个包含 1,000 个链接的链。出于某种原因，您决定从不同的人那里购买每个链接，因此您有 1,000 个不同的人向您提供链链接。为了使链条坚固，所有链接都必须坚固；哪怕只有一个薄弱环节也是不可接受的。

在这种情况下，问题在于测试某些链接并不能告诉您有关剩余链接的任何信息。即使您测试了其中的 999 个，您仍然对剩余的链接一无所知。因此，仅测试（比如说）750 个链接绝对是不够的。

正如我所提到的，为了在 95% 的置信水平下得出结论，没有一个链接是弱的，您需要测试其中的 950 个。此时，您可能想知道，“我为什么要停在 950？为什么不直接测试所有 1,000 个？” 答案是你是绝对正确的。您可能应该只测试所有 1,000 个链接，这样您就知道它们都很强大。

场景 2：您有一台制造链节的机器，并且您刚刚使用该机器制作了一批 1,000 个链节。如上所述，所有链接都必须坚固才能使链条坚固。您应该测试多少个链节才能确保您拥有坚固的链条？

如果您在现实世界中遇到这种情况，那么您应该尝试找出有关机器的更多信息。最好的情况是有两种类型的机器：一种只产生强链接，另一种只产生弱链接。在这种情况下，您只需要测试一个链接就可以知道所有链接都很强！

也许更现实的情况是，一些机器只产生强链接，而另一些机器产生 50% 的强链接和 50% 的弱链接。在这种情况下，为了达到 95% 的置信度，您只需要测试 5 个链接并查看它们都很强。

另一个有趣的案例是这些机器非常可靠，其中 99.9% 只产生强链接。在这种情况下，如果这台机器是从所有机器中随机选择的，那么您无需测试任何链接即可达到所有链接都强的 95% 置信水平。

当然，我无法描述所有可能的实际情况，但希望这能让您了解为什么 950 是原始问题的正确答案，以及为什么该答案在实践中不太可能非常有用。

正如维基百科链接中所解释的那样，“三法则”适用于（二项式）采样替换或从理论无限分布中采样。我怀疑这条规则是否适用于你的问题。

当然，要 100% 确定您的 1000 个小部件中的任何一个都没有缺陷，您必须查看所有这些小部件。

如果 1000 个中有一个有缺陷的小部件，那么通过查看 750 个随机选择的小部件找到它的机会只有超几何概率。在 R 中， $\frac{{1\choose 1}{999\choose 749}}{{1000\choose 750}} = 0.75,$

dhyper(1,  1, 999,   750)
[1] 0.75

如果您想在 1000 个中找到 95% 的缺陷，则需要对 950 个小部件进行抽样（无需更换）。

dhyper(1,  1, 999,   950)
[1] 0.95

如果 1000 个中有两个或多个缺陷品，那么（几乎）看 750 个就足够了。

sum(dhyper(1:2,  2, 998,  750))
[1] 0.9376877
sum(dhyper(1:2,  2, 998,  775))
[1] 0.9495495
sum(dhyper(1:2,  2, 998,  777))
[1] 0.9504444

早在 4 月，我就查看了这个问题的一个版本，看看我们可以根据合理数量的测试对消除 Covid 说些什么（剧透：不是很多）。

正如@keith 的回答所示，如果您想确保总体中没有一个失败，您需要对大部分总体进行抽样。在大多数情况下，这显然是不明智的。

正如@BruceET 在他的评论中所说，贝叶斯解决方案是有道理的。但是，因为数据中很少有关于人口中极少数故障的信息

假设您先采用作为失败概率。中没有失败后的后验是。因此，您可以查看该分布的分位数，并查看它何时集中到足够接近零以用于您想要的用途。 $Beta(a,b)$ $n$ $Beta(a+0,b+n)$

三法则规定，如果我对 N 进行抽样，那么我知道在 95% CL 时我的比率小于 3/N

我的期望值 E 是我的速率乘以总事件数 T。

E = T*3/N

剩余的总事件只是未采样的数量 T=1000-N

E = (1000-N)*3/N

我最多期望 1 所以 E=1

求解 N 给出

N = 1000 3/(1+3) = 1000 3/4 = 750

采样 3/4 似乎很多，所以我有一些疑问，但这是一个非常严格的要求。

也可以给出任何置信度的一般情况，其中多人游戏为 -ln(α)，α 为 1 减去置信度。

对于人口规模 P，一般情况是

N = P*ln(α)/(ln(α)-E)

其它你可能感兴趣的问题