机器算法验证 - 对于样本量为 1 的总体均值，我们能说什么？ - 吾爱随笔录

对于样本量为 1 的总体均值，我们能说什么？

机器算法验证意思是样本量小样本无偏估计器

2022-02-12 10:25:29

我想知道我们可以说什么，如果有的话，关于人口平均值当我只有一个测量值时，（样本大小为 1）。显然，我们希望有更多的测量值，但我们无法得到它们。 $\mu$ $y_1$

在我看来，由于样本均值微不足道地等于，因此。然而，在样本量为 1 的情况下，样本方差是未定义的，因此我们使用作为的估计量的信心也是未定义的，对吗？有什么方法可以限制我们对的估计吗？ $\bar{y}$ $y_1$ $E[\bar{y}]=E[y_1]=\mu$ $\bar{y}$ $\mu$ $\mu$

4个回答

如果已知总体是正常的，则基于单个观察的 95% 置信区间由 $x$

x \pm 9.68 | x |

$x \pm 9.68 \left| x \right|$

这在美国统计学家，2001 年 5 月，卷 55，第 2 号。（PDF）

当然有。使用贝叶斯范式。您可能至少可能是多少有所了解- 例如，它在物理上不能为负数，或者它显然不能大于 100（也许您正在测量当地高中橄榄球队成员的身高）英尺）。放上一个先验，用你唯一的观察来更新它，你就有了一个美妙的后验。 $\mu$

一个小的模拟练习来说明@soakley 的答案是否有效：

# Set the number of trials, M
M=10^6
# Set the true mean for each trial
mu=rep(0,M)
# Set the true standard deviation for each trial
sd=rep(1,M)
# Set counter to zero
count=0
for(i in 1:M){
 # Control the random number generation so that the experiment is replicable 
 set.seed(i)
 # Generate one draw of a normal random variable with a given mean and standard deviation
 x=rnorm(n=1,mean=mu[i],sd=sd[i])
 # Estimate the lower confidence bound for the population mean
 lower=x-9.68*abs(x)
 # Estimate the upper confidence bound for the population mean
 upper=x+9.68*abs(x)
 # If the true mean is within the confidence interval, count it in
 if( (lower<mu[i]) && (mu[i]<upper) ) count=count+1
}
# Obtain the percentage of cases when the true mean is within the confidence interval
count_pct=count/M
# Print the result
print(count_pct)
[1] 1

在 100 万次随机试验中，置信区间包括 100 万次的真实均值，即总是。如果置信区间为95%置信区间，则不应发生这种情况。

所以这个公式似乎不起作用......还是我犯了一个编码错误？

编辑：使用时同样的经验结果成立 $(\mu, \sigma)=(1000,1)$ ;
然而，它是 $0.950097 \approx 0.95$ 为了 $(\mu, \sigma)=(1000,1000)$ - 因此非常接近 95% 的置信区间。

这是一篇针对泊松案例的关于这个问题的全新文章，采用了一种很好的教学方法：

安德森。每格斯塔（2015 年）。使用一次观察构建泊松均值的近似置信区间的课堂方法。美国统计学家, 69(3), 160-164, DOI: 10.1080/00031305.2015.1056830。

其它你可能感兴趣的问题

上一篇异方差数据的单向方差分析的替代方案下一篇xgboost算法中min_child_weight的解释