我有一个小样本(n = 8),我已经计算了平均值和平均值的标准误差。我不知道这些观察的基本分布,我不能假设它是正常的。
我想得出均值的 95% 置信区间,并且我看到人们使用学生 t 分布和标准误差来计算置信区间。但似乎该方法要求观察结果本身来自正态分布。
在我的案例中,我应该如何计算出 95% 的置信区间?
我有一个小样本(n = 8),我已经计算了平均值和平均值的标准误差。我不知道这些观察的基本分布,我不能假设它是正常的。
我想得出均值的 95% 置信区间,并且我看到人们使用学生 t 分布和标准误差来计算置信区间。但似乎该方法要求观察结果本身来自正态分布。
在我的案例中,我应该如何计算出 95% 的置信区间?
这有点棘手。有几种方法:
假设分布与正态分布“不太远”(在特定意义上),并且 t 间隔将接近所需的覆盖范围。t 至少对与假设的轻微偏差相当稳健,因此,如果总体分布不是特别偏斜或特别重尾,那至少应该可以很好地工作。
假设分布是对称的*,并通过 Wilcoxon 符号秩型过程为伪中值(Hodges-Lehmann 估计,成对平均值的中值)构造一个区间。如果 t 分布是正确的,那么平均而言,这样做你损失的很少。这可以在许多包中完成。
[对于存在均值的对称分布,均值、伪中值、普通中值(以及许多其他位置度量)重合。包含具有特定概率的区间也将包含其他区间]
*(或至少“足够”接近它)
这是在 R 中完成的示例:
y <- rlogis(8,50,1)
wilcox.test(y,conf.int=TRUE)
Wilcoxon signed rank test`
data: y
V = 36, p-value = 0.007813
alternative hypothesis: true location is not equal to 0
95 percent confidence interval:
47.49677 52.22811
sample estimates:
(pseudo)median
49.55069
所以给定的区间是 (47.50, 52.23):

紫色垂直线段是样本均值,中心蓝色线段是样本伪中值。外部的蓝色段标记置信区间的末端。您会看到,在此示例中,区间包括 50 的真实总体平均值。
假设对称性并从不会被置换测试拒绝的平均值构造一个 CI(这可以从单个置换测试分布中完成,并且 8 次观察足以获得整个置换分布而不是对其进行采样)。
使用自举构建均值的 CI。bootstrap 由渐近参数证明是合理的(因此它可能不适用于小样本),但您可以做出各种分布假设并通过模拟检查其覆盖属性以获得合理分布。这篇论文(pdf 可在该链接上下载)表明 bootstrap-t 区间通常比通常的 t 区间获得更好的覆盖特性——但当样本较小且分布偏斜时,覆盖率可能较差。
如果你有一些额外的信息可以帮助指导分布的选择,你可以得到其他分布假设的地方。例如,如果您知道分布是偏斜且连续的,您可以尝试使用 Gamma 或对数正态模型(例如)来构建均值的 CI。或者,如果您有计数数据,您可以使用泊松、二项式或负二项式模型来尝试构建一个区间。
如果您不知道分布,则 8 次观察无法完成任何事情。报告您的标准偏差。您可以尝试使用 chebyshev 或类似的不等式,但它们通常太宽以至于仅在理论论文中使用
想想 95%。我知道尝试从数据中挤出尽可能多的信息是一种时尚,但是,来吧,让我们保持理性,有 8 个数据点,您可以希望得到 12.5% 和 87.5% 的百分位数。也许您可以做一些花哨的事情并稍微移动边缘,但要达到 95%?!