如果你有一个样本来自向量中的正常总体, R中的过程将为你提供总体均值的样本从如下所示。(无需手动计算。)X1,X2,…,Xnx
t.test
(49.19,50.33)μ,n=20Norm(μ=50,σ=7),
set.seed(2021)
x = rnorm(20, 50, 7)
t.test(x)$conf.int
[1] 49.19194 56.32578
attr(,"conf.level")
[1] 0.95
此过程也适用于测试,但您可以使用$
符号来仅显示置信区间。
该置信区间的形式为其中是样本均值,是样本标准差,
从上尾切开概率具有个自由度的学生 t 分布。X¯±t∗s/n−−√,X¯st∗0.025n−1=19
a = mean(x) # sample mean
s = sd(x) # sample standard deviation
t.q = qt(.975, 19) # quantiles .025 and .975 of T(19)
a; s; qt(.975,19)
[1] 52.75886
[1] 7.621391
[1] 2.093024
a + qt(c(.025,.975), 19)*s/sqrt(20)
[1] 49.19194 56.32578
请注意,(对称)t 分布的适当分位数是而标准正态分布的相同分位数是当的 95% 置信区间的分位数不远;两个分位数都舍入到[但是对于 95% 以外的置信水平,这条“30 条规则”并不适用。对于 90% CI,正常分位数为对于,t 分位数为±2.09,±1.96.n≥30,T(n−1)±1.96;2.0.±1.645≈±1.6;n=30±1.699≈±1.7.]
qnorm(c(.025,.975))
[1] -1.959964 1.959964
如果出于某种原因,您希望在上面的示例中为提供 90% 或 99% 的置信区间,您也可以使用. 请注意,99% 置信区间是此处给出的三个 CI 中最长的一个(90%、95%、99%)。μt.test
t.test(x, conf.level = .90)$conf.int
[1] 49.81208 55.70564
attr(,"conf.level")
[1] 0.9
t.test(x, conf.level = .99)$conf.int
[1] 47.88327 57.63445
attr(,"conf.level")
[1] 0.99
最后,假设我们不知道数据x
的正态分布中采样的,我们想要测试和
以下是来自.μ=50,H0:μ=50Ha:μ≠50.t.test
t.test(x, mu = 50)
One Sample t-test
data: x
t = 1.6189, df = 19, p-value = 0.122
alternative hypothesis:
true mean is not equal to 50
95 percent confidence interval:
49.19194 56.32578
sample estimates:
mean of x
52.75886
,所以在 5% 的显着性水平上不会拒绝原假设。
因此,包含在 95% CI 中。0.122>0.05=5%.μ0=50