在 R 中执行 Wilcoxon.test 时如何建立置信区间?

机器算法验证 置信区间 非参数 威尔克森符号秩
2022-03-18 23:58:14

我想计算从该数据集获得的中位数周围的置信区间:

dat <- c(2.10, 2.35, 2.35, 3.10, 3.10, 3.15, 3.90, 3.90,  4.00,  4.80, 5.00,  5.00,  5.15,  5.35,  5.50,  6.00,  6.00,  6.25,  6.45)

描述性统计:

summary(dat)
 Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
2.100   3.125   4.800   4.392   5.425   6.450 

我找不到与 wilcoxon 测试结果一起呈现的置信区间是如何计算的:

wilcox.test(dat, conf.int = T, correct = T, exact = F, conf.level = .99)
    Wilcoxon signed rank test with continuity correction

data:  dat
V = 190, p-value = 0.0001419
alternative hypothesis: true location is not equal to 0
99 percent confidence interval:
 3.450018 5.499933
sample estimates:
(pseudo)median 
      4.400028 

我只想使用非参数方法估计具有置信区间的总体中位数。上面显示的置信区间与 Wilcoxon 符号秩检验有何关系?

1个回答

我只想使用非参数方法估计具有置信区间的总体中位数。

请注意,为有符号秩检验生成的区间是针对单样本 Hodges-Lehmann 统计量(伪中位数)的总体版本,而不是中位数。

在对称性假设下(在有符号秩检验的空值下这是必需的,但在替代方案下不一定是必需的,这是您计算置信区间的依据),两个总体数量将重合。您可能很乐意做出这个稍微强一些的假设,但请记住,样本中位数很有可能落在由此生成的 CI 之外。

上面显示的置信区间与 Wilcoxon 符号秩检验有何关系?

这是伪中位数的一组值,不会被有符号排名统计量拒绝。您实际上可以通过这种方式找到限制;这是获得统计置信区间的一种非常通用的方法,您没有更简单的方法可以做到这一点。

有一种特定的方法可以找到签名等级测试的限制,不需要您这样做,但是您可以使用搜索方法通过这种通用方法快速到达那里。

有符号秩检验的更具体的方法是基于 Walsh 平均值的对称顺序统计对(每个(i,j)一对12(Xi+Xj), 为了ij...即包括与自身平均的每个点)。有符号秩统计量是正数Ws。

那么如果我们标记这些平均值Wk,k=1,2,...,m在哪里m=n(n+1)/2, 对应的区间将是对称的阶数对(W(k),W(m+1k))k选择尽可能小,但仍会导致测试的非拒绝区域中的端点。

此pdf详细概述了这一点。)