对于样本量为 1 的总体均值,我们能说什么?

机器算法验证 意思是 样本量 小样本 无偏估计器
2022-02-12 10:25:29

我想知道我们可以说什么,如果有的话,关于人口平均值当我只有一个测量值时,(样本大小为 1)。显然,我们希望有更多的测量值,但我们无法得到它们。μy1

在我看来,由于样本均值微不足道地等于,因此然而,在样本量为 1 的情况下,样本方差是未定义的,因此我们使用作为的估计量的信心也是未定义的,对吗?有什么方法可以限制我们对的估计吗?y¯y1E[y¯]=E[y1]=μy¯μμ

4个回答

如果已知总体是正常的,则基于单个观察的 95% 置信区间由x

x±9.68|x|

这在美国统计学家2001 年 5 月,卷 55,第 2 号PDF

当然有。使用贝叶斯范式。您可能至少可能是多少有所了解- 例如,它在物理上不能为负数,或者它显然不能大于 100(也许您正在测量当地高中橄榄球队成员的身高)英尺)。放上一个先验,用你唯一的观察来更新它,你就有了一个美妙的后验。μ

一个小的模拟练习来说明@soakley 的答案是否有效:

# Set the number of trials, M
M=10^6
# Set the true mean for each trial
mu=rep(0,M)
# Set the true standard deviation for each trial
sd=rep(1,M)
# Set counter to zero
count=0
for(i in 1:M){
 # Control the random number generation so that the experiment is replicable 
 set.seed(i)
 # Generate one draw of a normal random variable with a given mean and standard deviation
 x=rnorm(n=1,mean=mu[i],sd=sd[i])
 # Estimate the lower confidence bound for the population mean
 lower=x-9.68*abs(x)
 # Estimate the upper confidence bound for the population mean
 upper=x+9.68*abs(x)
 # If the true mean is within the confidence interval, count it in
 if( (lower<mu[i]) && (mu[i]<upper) ) count=count+1
}
# Obtain the percentage of cases when the true mean is within the confidence interval
count_pct=count/M
# Print the result
print(count_pct)
[1] 1

在 100 万次随机试验中,置信区间包括 100 万次的真实均值,即总是如果置信区间为95%置信区间,则不应发生这种情况

所以这个公式似乎不起作用......还是我犯了一个编码错误?

编辑:使用时同样的经验结果成立(μ,σ)=(1000,1);
然而,它是0.9500970.95为了(μ,σ)=(1000,1000)- 因此非常接近 95% 的置信区间。

这是一篇针对泊松案例的关于这个问题的全新文章,采用了一种很好的教学方法:

安德森。每格斯塔(2015 年)。使用一次观察构建泊松均值的近似置信区间的课堂方法。美国统计学家, 69(3), 160-164, DOI: 10.1080/00031305.2015.1056830