Wilcoxon 秩和检验和 Wilcoxon 有符号秩检验有什么区别?

机器算法验证 配对数据 威尔克森符号秩 wilcoxon-mann-whitney 检验
2022-02-13 11:46:22

我想知道 Wilcoxon 秩和检验和使用配对观察的 Wilcoxon 符号秩检验之间的理论区别是什么。我知道 Wilcoxon 秩和检验允许在两个不同样本中进行不同数量的观察,而配对样本的符号秩检验不允许这样做,但是,在我看来,它们似乎都测试相同。

有人可以给我一些关于何时应该使用 Wilcoxon 秩和检验以及何时应该使用配对观察使用 Wilcoxon 符号秩检验的背景/理论信息吗?

2个回答

当数据配对时,您应该使用有符号秩检验。

您会发现配对的许多定义,但本质上,标准是使配对值至少在某种程度上正相关,而未配对的值不依赖。通常发生依赖配对是因为它们是对同一单位的观察(重复测量),但它不必在同一个单位上,只是以某种方式倾向于相关联(同时测量同一种事物) ,被视为“配对”。

当数据未配对时,您应该使用秩和检验。

基本上就是这样。

请注意,具有相同的n并不意味着数据是配对的,并且有不同的n并不意味着没有配对(可能是一些配对由于某种原因丢失了观察结果)。配对来自对采样内容的考虑。

当数据配对时使用配对测试的效果是,它通常可以提供更多的力量来检测您感兴趣的变化。如果关联导致强依赖性*,那么力量的增益可能是可观的。

* 具体来说,但有点松散地说,如果效果大小与配对差异的典型大小相比较大,但与非配对差异的典型大小相比较小,您可以通过配对测试在 a样本量非常小,但仅在更大的样本量下进行非配对测试。

但是,当数据未配对时,将数据视为配对可能会(至少稍微)适得其反。也就是说,在许多情况下,损失功率的成本可能非常小 - 我针对这个问题所做的一项功率研究似乎表明,平均而言,典型小样本情况下的功率损失(比如 n 阶在调整显着性水平差异后,每个样本中的 10 到 30 个)可能非常小。

[如果你真的不确定数据是否配对,将未配对数据视为配对的损失通常相对较小,而如果它们配对,收益可能会很大。这表明如果您真的不知道,并且有办法找出配对的内容与假设它们配对的内容 - 例如表中同一行中的值,那么在实践中采取行动可能是有意义的就好像数据被配对是安全的——尽管有些人可能会因为你这样做而变得非常疲惫。]

我不是研究人员,但我是统计学专业的。我将首先列出 Wilcoxon 有符号秩和检验 (WSRST) 的要求。

  • WSRST要求人群是配对的,例如,同一组人在两个不同的场合或事物上进行测试,并衡量每个人的影响,然后我们比较两个事物或场合。
  • WSRST 要求数据是定量的。定量数据是按比例测量的数据,这就是为什么我强调在第一点测量的世界。如果参与者被要求对他们的回答进行排名,那么您将处理定性数据,然后您将不得不使用符号检验来检验您的假设。

[WSRST 还有其他要求,但我列出的足以区分这两个测试]

现在是 Wilcoxon 秩和检验 (WRST)

  • 主要要求是样本来自独立的总体。例如,您可能想测试试卷 1 是否比试卷 2 更难,为此您将有两组学生,并且组的大小不必相同。从示例来看,两组是独立的,如果您要求同一组写两次同一篇论文,那么您将使用 WSRST 来检验您的假设。
  • 另一个要求是数据不必是定量的,即您也可以对定性数据进行测试。