Wilcoxon 符号秩检验零假设陈述

机器算法验证 假设检验 威尔克森符号秩
2022-04-10 03:05:25

我进行了单边 Wilcoxon 符号秩 (WSR) 测试。我有一对匹配的连续随机变量,比如对于我的系统,可以安全地假设在原假设下,都是相同分布的因此,差异,比如应该在 0 附近具有对称分布,即在零假设下。此外,是独立的。因此,我认为满足 Wilcoxon 符号秩检验的假设。因此,我进行了单边测试来检查是否倾向于大于 0。X1,X2,...,XnY1,Y2,...,YnXiYiiUi=XiYiUiUi

我正在写一份关于我的分析的报告,但我对如何准确地表达测试有点困惑。以下是我考虑过的几个陈述。

  1. 的总体均值的单边替代方案检验零假设Ui>0

  2. 的总体中位数的单边替代方案检验零假设Ui>0

我注意到 WSR null 通常以中位数报告。一方面,我不清楚为什么会这样。其次,我的理解是,由于在零假设下对称分布于 0 左右,因此均值和中位数应该相同。所以也许,应该可以用均值来描述测试。如果是这样,我更愿意用平均值来报告,因为我的很多读者可能不知道 WSR。如果他们以均值的形式阅读陈述,他们可能会发现很容易将其简单地视为两个样本 t 检验的替代方案。Ui

如果您对报告测试的更好方法有建议,请告诉我。

我已经通过 Stackexchange 阅读了几个答案,但找不到我正在寻找的确切内容。另外,我阅读了一篇论文(Li and Johnson, 2014, Pharmaceutical Statistics; DOI: 10.1002/pst.1628),其中描述了两个不同的零假设——一个用于“中位数检验”,另一个用于“对称性检验”,名称为Wilcoxon 符号秩检验。

我只是将wilcox.testR 中的函数用作wilcox.test(X, Y, alternative = "greater", paired = T). 我如何知道我的测试是“中位数测试”还是“对称性测试”?

2个回答

这个答案在被接受后已被修改,因为我没有充分理解 Wilcoxon 对符号检验的批评以扩展零假设。我在最后解决了修改后的答案和以前的答案之间的区别

Wilcoxon 符号等级检验具有这些无效假设和替代假设(参见 Snedecor, GW 和 Cochran, WG (1989) Statistical Methods , 8th edition. Iowa State University Press: Ames, IA.):

H0:成对差异的大小关于零对称分布。

HA:成对差异的大小不是对称分布的,或者不是关于零分布的,或者两者兼而有之。

(随着样本量的增加,关于零的对称分布迅速接近正态分布。参见 Belera,2010。)

许多介绍性文本将带符号的等级测试作为中位数差异的测试,或者在我的经验中很少使用均值差异,但没有提到这种解释需要两个相当严格的假设:

  1. 两组的分布必须具有相同的形状。

  2. 两组的方差必须相等。

如果这两个假设都是正确的,那么有符号秩检验可以有效地解释为具有相等中位数(或相等均值)的零假设。

参考资料
Bellera, CA, Julien, M. 和 Hanley, JA (2010)。Wilcoxon 统计分布的正态近似:精确到多少图形洞察力n统计教育杂志,18(2):1-17。

威尔科克森,F. (1945)。通过排名方法进行个体比较生物识别公报,1(6):80-83。


我修改答案的动机

我之前接受的答案是零假设和替代假设在成对观察中:

H0:P(XA>XB)=0.5;HA:P(XA>XB)0.5

这些是关于相对随机大小(有时是零阶随机优势)的零假设和替代假设。简单来说,原假设是来自组的随机观察超过来自组的配对观察的概率是一半(即,组中的随机观察大于和小于的概率相同)组中的配对观察)。ABAB

用简单的语言来说,替代假设是这个概率不是一半(即,一组比另一组更可能大于另一组)。

但是符号秩可能由于不对称而为假(因为秩差的幅度在一个方向上大于另一个方向),因此即使当时,如果时大得多因此,等级差异的大小就是为什么符号等级测试必须将对称性纳入我的修订版中的零值。感谢@SalMangiafico 的耐心指导。P(XA>XB)=0.5XA>XBXA<XB

在一般情况下,Wilcoxon 秩和检验 (WRS) 既不涉及平均值也不涉及中位数,因此我认为在描述检验时我会避免提及其中任何一个。

很容易想到差异中位数为 0 但 WRS 拒绝原假设的情况。(在我对@Alexis 的回答的评论中给出了一个这样的案例)。如果您真的想要测试差异的中位数,则符号测试是合适的测试。

我认为,你想如何描述测试取决于你的听众。

(双边情况的)零假设是差异的等级关于 0 对称。如果您能够呈现实际差异的直方图并且能够说“看? 差异的等级基本上是对称的,以 2 为中心。” 或者,“看,它们不是对称的;正面有许多较高的值,而较低的一面则较少,这表明......”

但这可能无法很好地转化为您实际要指出的内容,例如某些干预增加了一些可衡量的东西。

根据观众的不同,最好对测试含糊其辞,例如“我进行了 WRS 以查看从时间 1 到时间 2 是否有增加”。如果您对此感觉不好,可以添加一个脚注来描述测试。

有一些可视化的方式来呈现可能对观众很有意义的结果。例如,这里是相同的数据:

作为具有 1:1 线的散点图

作为一系列的差异吧

作为差异的直方图