我想知道我们可以说什么,如果有的话,关于人口平均值当我只有一个测量值时,(样本大小为 1)。显然,我们希望有更多的测量值,但我们无法得到它们。
在我看来,由于样本均值微不足道地等于,因此。然而,在样本量为 1 的情况下,样本方差是未定义的,因此我们使用作为的估计量的信心也是未定义的,对吗?有什么方法可以限制我们对的估计吗?
我想知道我们可以说什么,如果有的话,关于人口平均值当我只有一个测量值时,(样本大小为 1)。显然,我们希望有更多的测量值,但我们无法得到它们。
在我看来,由于样本均值微不足道地等于,因此。然而,在样本量为 1 的情况下,样本方差是未定义的,因此我们使用作为的估计量的信心也是未定义的,对吗?有什么方法可以限制我们对的估计吗?
当然有。使用贝叶斯范式。您可能至少可能是多少有所了解- 例如,它在物理上不能为负数,或者它显然不能大于 100(也许您正在测量当地高中橄榄球队成员的身高)英尺)。放上一个先验,用你唯一的观察来更新它,你就有了一个美妙的后验。
一个小的模拟练习来说明@soakley 的答案是否有效:
# Set the number of trials, M
M=10^6
# Set the true mean for each trial
mu=rep(0,M)
# Set the true standard deviation for each trial
sd=rep(1,M)
# Set counter to zero
count=0
for(i in 1:M){
# Control the random number generation so that the experiment is replicable
set.seed(i)
# Generate one draw of a normal random variable with a given mean and standard deviation
x=rnorm(n=1,mean=mu[i],sd=sd[i])
# Estimate the lower confidence bound for the population mean
lower=x-9.68*abs(x)
# Estimate the upper confidence bound for the population mean
upper=x+9.68*abs(x)
# If the true mean is within the confidence interval, count it in
if( (lower<mu[i]) && (mu[i]<upper) ) count=count+1
}
# Obtain the percentage of cases when the true mean is within the confidence interval
count_pct=count/M
# Print the result
print(count_pct)
[1] 1
在 100 万次随机试验中,置信区间包括 100 万次的真实均值,即总是。如果置信区间为95%置信区间,则不应发生这种情况。
所以这个公式似乎不起作用......还是我犯了一个编码错误?
编辑:使用时同样的经验结果成立;
然而,它是为了- 因此非常接近 95% 的置信区间。
这是一篇针对泊松案例的关于这个问题的全新文章,采用了一种很好的教学方法:
安德森。每格斯塔(2015 年)。使用一次观察构建泊松均值的近似置信区间的课堂方法。美国统计学家, 69(3), 160-164, DOI: 10.1080/00031305.2015.1056830。