在使用基础分布参数的统计模型中,这些参数对应于无限人口(称为“超人口”)的经验分布的各个方面。因此,对于处理模型参数的统计检验和置信区间,我们隐含地对与无限总体相关的数量进行推断。如果我们希望对与有限总体相关的数量进行推断,这通常通过对标准检验和置信区间进行调整来完成,称为有限总体校正(FPC)。
当我们有个单位的有限总体时,FPC 术语“消失”为,反映了该术语是对情况的“调整”这一事实。此外,在大多数应用中,FPC 项往往由采样值的比例决定N∈NN→∞N=∞--- 当这接近零时,相关方程中的术语“消失”。您正在阅读的这本书的作者可能认为,当样本值在总体中的比例小于 10% 时,FPC 调整足够小,可以安全地忽略,而当它大于 10% 时,足够大,不容忽视。这是一种武断的划分,我真的看不出有任何意义。在我看来,当你对有限的人口进行推断时,不管它的大小如何,最好只使用 FPC。
一个应用示例:假设您观察数据点并希望获得总体平均值的置信区间。如果您使用标准置信区间作为基础分布的平均参数(隐含无限超群的平均值),那么您的区间具有以下形式:n
CI(1−α)=[x¯±tn−1,α/2n−−√⋅s].
但是,我们可以在该公式中添加“有限总体校正”项,以获得个单位的有限总体均值的置信区间:N
CI(1−α)=[x¯±N−nN−−−−−−√⋅tn−1,α/2n−−√⋅s].
您可以看到 FPC 项是一个乘法项,等于总体中未抽样值比例的平方根。随着未采样的比例接近 1(并且采样的比例接近零),因此 FPC 术语“消失”。您还可以看到,后一个公式为您提供了一个允许任何采样比例的置信区间,因此没有必要提出一个“经验法则”来确定采样比例应该有多低。N→∞
现在,当我们对 10% 的人口进行抽样时,FPC 项为,显然您的书的作者认为这已经足够接近可以安全忽略的值(但如果样本比例高于 10% 则调整不容忽视)。您的书的作者本质上是在断言“经验法则” --- if then,这意味着您可以采用而不会出现严重错误。正如我上面所说,我的偏好是避免任何此类规则,并在对有限总体进行推断时简单地使用 FPC 术语。0.9−−−√≈0.9487n/N⩽0.9FPC⩾0.9487FPC=1