我是统计新手,所以如果我在这里做出任何错误的假设,请告诉我。
有N
一群人。(例如N
可以是 1,000,000。)有些人是红发女郎。我抽取了一个n
人样本(比如 10 个),发现其中j
的人是红发女郎。
关于人口中红发的总体比例,我能说些什么?我的意思是,我的最佳近似值可能是j/n
,但该近似值的标准偏差是多少?
顺便说一句,这个被接受的术语是什么?
我是统计新手,所以如果我在这里做出任何错误的假设,请告诉我。
有N
一群人。(例如N
可以是 1,000,000。)有些人是红发女郎。我抽取了一个n
人样本(比如 10 个),发现其中j
的人是红发女郎。
关于人口中红发的总体比例,我能说些什么?我的意思是,我的最佳近似值可能是j/n
,但该近似值的标准偏差是多少?
顺便说一句,这个被接受的术语是什么?
如果您的样本量不是您的示例中总体大小的一小部分,并且如果您在没有替换的情况下进行抽样 [Sw/oR],则 [估计] SE 的更好表达是
其中是估计的比例和。
[术语称为 FPC [有限总体校正]。
尽管 whuber 的评论在技术上是正确的,但似乎表明无法做任何事情来获得真实比例的置信区间。如果大到足以使正态近似合理[ ],则不太可能得到。此外,如果样本量足够大,使用真实的正态近似是合理的,则使用也可以给出合理的近似。
[如果您的非常小并且您使用 Sw/oR,您可能必须使用的精确超几何分布而不是正态近似。如果你做 SwR,的大小是无关紧要的,你可以使用精确的二项式方法来获得的 CI 。]
在任何情况下,由于,人们总是可以保守地使用代替 。如果您这样做,则需要 .03的估计 ME [误差范围 = 2 ]有多大!]。