如果一个随机样本都呈阳性,那么可以推断出人口的什么?

机器算法验证 采样 推理
2022-03-19 04:21:34

具体来说,假设我从 1000 个制造批次中随机抽取 20 个产品样本,它们都测试良好,我可以对整批产品做出哪些假设和结论?是否可以说“整批产品有 x% 的可能性”?在这种情况下,我如何计算 x?请注意,这是假设我事先不知道缺陷率应该是多少。

2个回答

1000个中有20个是好的。对于剩余的 980,好产品的数量可以从 0 到 980。计算从 1000 个制造批次中随机抽取 20 种产品的概率,当好产品的数量为 20、21、... , 1000 中的 1000。(共 981 个概率)。将它们加在一起作为分母,最后一个(1000 种商品中的 1000 种商品)作为分子。这个比率就是你的 x。

Y是 1000 个产品中好产品的数量。因为没有先验信息,我们假设Pr(Y=k)=1/1001因为Y可以是 0, 1, ..., 1000。它是均匀分布的,经常用作无信息先验。

B假设从 1000 种产品中随机抽取 20 种产品,所有 20 种产品都是好的。

所以问的问题是

Pr(Y=1000|B)

所以Pr(Y=1000|B)=Pr(B|Y=1000)Pr(Y=1000)y=01000Pr(B|Y=y)Pr(Y=y)

=1/10011/1001Pr(B|Y=1000)y=01000Pr(B|Y=y)

=Pr(B|Y=1000)y=01000Pr(B|Y=y)

=1/47.666667=0.02097902 大约 2.1%

在简单随机样本的假设下,20个采样单元中的好单元数服从超几何分布。所以

Pr(B|Y=y)=(y20)(9800)(100020)=(y20)(100020). 需要知道(y20)=0为了y<20

事实上,任何具有超几何分布概率密度函数的软件都可以进行计算。

您可以为无缺陷的比例 p 构建置信区间。区间将是单边的 [pc, 1] 说 95% 这给了你一个基于间隔宽度的想法( [1-pc,1] ) 您对该比例接近 100% 的信心程度。这将基于超几何分布。

基于 Bill Huber 对贝叶斯方法的评论。这表明在没有先验知识的情况下可以说很多话。这种计算严格基于频率论方法。