如何使用 R 解释方差 F 检验的置信区间?

机器算法验证 r 置信区间 f检验
2022-03-17 09:01:19

我试图了解 R 中函数 var.test() 返回的置信区间。更具体地说,var.test() 返回的置信区间不是我在计算 F 检验时找到的置信区间我。例如 :

> s1 <- 10:12 ; s2 <- 13:16
> var(s1)
[1] 1
> var(s2)
[1] 1.666667
> var.test(s1,s2)

    F test to compare two variances

data:  s1 and s2 
F = 0.6, num df = 2, denom df = 3, p-value = 0.7926
alternative hypothesis: true ratio of variances is not equal to 1 
95 percent confidence interval:
  0.03739691 23.49929674 
sample estimates:
ratio of variances 
               0.6

此处的 95% 置信区间为 [0.037,23.499]。我将“置信区间”解释为“拒绝区域”,即如果检验统计量 F 在此区间内,则对于给定的统计水平(此处为 95%),应接受零假设。但是,当我尝试计算时,我发现:

> qf(c(0.025,0.975),length(s1)-1,length(s2)-1)
[1]  0.02553268 16.04410643

因此,当我将 var.test() 的“置信区间”解释为“拒绝区域”时,我想我错了。

所以我的问题是:这个置信区间代表什么?

2个回答

您的方法使用qf计算拒绝区域,您将与 2 方差的比率进行比较。使用中心 F 是正确的做法,因为我们在假设原假设为真并且如果原假设(方差相等)为真的情况下计算拒绝区域,则我们有一个中心 F 分布。

置信区间公式的推导遵循这些路线(我只显示下限,一些轻微的修改给出上限)

v1σ12/v2σ22f(df1,df2)

v1v2×σ12σ22f(df1,df2)

prob(v1v2×σ22σ12>f0.975)=0.025

prob(σ12σ22<v1v2/f0.975)=0.025

因此置信区间也基于中心 F,因为它正在估计 2 个真实方差的比率。

在 R 中“手动”获取值

vr <- var(s1)/var(s2)
vr/qf(.975,2,3)

匹配的结果var.test()

测试的拒绝区域和置信区间是不同的东西。拒绝区域是您拒绝方差比等于的原假设的区域。100( 1置信区间是一个区间,它具有在重复抽样中将包含案例中的真实参数值的属性。置信区间和相关假设检验之间存在 1-1 对应关系,但这并不意味着即使置信水平与检验的显着性水平相同,拒绝区域也等于置信区域。1100(1α)%100(1α)%