小样本和未知总体标准差的置信区间公式

机器算法验证 置信区间
2022-04-02 10:53:58

我已经查阅了两篇关于如何在 N 较小且总体标准差未知时计算置信区间的文本。他们给出的公式存在一些差异,最终结果取决于我遵循的文本(尽管差异不大)。文字一说:

  1. 计算平均值
  2. 使用公式计算标准偏差:s= √ ((∑ X(squared)/N)–X-bar)
  3. 使用公式计算平均值的标准误差:s/√ N-1
  4. 从 t 表中确定 T 的值
  5. 通过将平均值的标准误差乘以在步骤 4 中获得的值来获得误差范围。
  6. 从样本均值中加减该乘积以获得 CI

步骤,1,4,5&6 在第二个文本中完全相同。但是,它为步骤 2 和 3 提供了不同的公式。它说:

  1. 使用以下公式计算标准偏差:s= √ ((∑ X(squared) /N-1) –X-bar)。不同之处在于它们将 N 减一。
  2. 使用公式计算均值的标准误:s/√N 不同的是,N 没有减 1。

谁能解释为什么使用不同的公式以及为什么?

谢谢。安妮小号

1个回答

这里有一些关于标准差和平均值的标准误差的很好的说明

Wackerly 等人的文本在第 8.8 节(第 430 页)中计算小样本置信区间,您可以在此处查看他们的公式。

置信区间:Y¯±tα/2Sn

在哪里y¯=1nyi(样本均值)

S=1n1(yiy¯)2(样本标准差)

α/2是给定值的临界值α(例如,0.1、0.05 等)并且具有 n-1 个自由度,其中 n 是样本大小,您可以在table 中找到。

现在,如果您的样本占已知有限人口规模的很大一部分,则有一种称为人口校正因子的东西,但对于基本需求,您可能不必担心这一点。