符号秩检验(及其相关性)的对称性假设对我来说变得非常混乱。我假设亚群 A(治疗前)和亚群 B(治疗后)来自同一群体(没有治疗效果)。我的配对差异是否需要符合对称性假设?
jbowman 在他的回复中指出:“请注意,在典型的零假设下,如果您假设子总体 A 和 B 来自相同的分布,那么无论基础分布。” 而其他地方的文本说“如果您正在测试配对差异的平均值(=中位数)为零的零假设,那么配对差异必须全部来自连续对称分布。”
符号秩检验(及其相关性)的对称性假设对我来说变得非常混乱。我假设亚群 A(治疗前)和亚群 B(治疗后)来自同一群体(没有治疗效果)。我的配对差异是否需要符合对称性假设?
jbowman 在他的回复中指出:“请注意,在典型的零假设下,如果您假设子总体 A 和 B 来自相同的分布,那么无论基础分布。” 而其他地方的文本说“如果您正在测试配对差异的平均值(=中位数)为零的零假设,那么配对差异必须全部来自连续对称分布。”
尽管从表面上看,上面的两个陈述似乎相互矛盾,但事实并非如此。Wilcoxon Signed Rank 检验确实要求配对差异来自连续对称分布(在原假设下,正如 Michael Chernick 在评论中指出的那样)。在特殊情况下,当两个子群体和从中抽取配对样本(每个样本来自和) 具有相同的(连续)分布,保证样本之间的成对差异将来自一个连续的对称分布。
您可以通过观察如果两个样本来自相同的分布来看到这一点,. 在前一种情况下,成对差异,在后一种情况下,成对差异. 由于这两种情况的概率相等,因此可以得出,即分布在 0 附近对称。
因此,如果您可以假设两个子总体在原假设下具有相同的连续分布,那么您就满足了 Wilcoxon Signed Rank 假设要求。通常更容易理解为什么这个假设可能是正确的,而不是理解为什么更一般的“成对差异来自连续对称分布”可能是正确的,因此它偶尔使用。
请注意,样本可能不会告诉您关于null所需假设的适用性。如果 null 为假,则您不一定需要对称性(并且很容易演示在替代方案下一切都按预期工作而不需要对称性的示例)。
人们似乎花费了大量精力来担心使用可能与假设是否合理的问题无关的数据来测试假设。甚至在看到数据之前考虑其合理性可能会更好地处理该假设(jbowman 的出色回答详细介绍了这一点;假设处理根本不会改变分布,它应该立即遵循)。
[这并不意味着替代方案下的情况是任意的(它是一种对特定类型的对称偏差敏感的测试,它对成对差异为零,并且对其他类型的偏差不敏感) - 你仍在寻找一种趋势差异通常大于 0 或通常小于 0]
此外,测试假设(然后根据您是否拒绝先前测试中的空值来选择您所做的事情)将影响您正在考虑的后续过程的属性(在空值下 p 值将不再是统一的) , 例如)。
在某些情况下,假设位置偏移替代方案可能很方便(当然可以估计其大小,甚至给出置信区间)。例如,它会使讨论治疗效果变得更简单。然而,这并不能使它成为测试本身的假设,它使它成为我们出于其他原因所做的额外假设。在这种情况下,数据可能与评估该假设是否合适有关,但我们仍然存在一个问题,如果我们根据数据选择测试,我们将不再具有我们想要的显着性水平(也有影响力量)。
这与其说是一个答案,不如说是要求受访者进一步澄清,也许是澄清本身。
这里有几个来自教科书的例子,展示了有时如何处理有符号秩检验的对称假设。在我的书架上,我找不到更清楚或更解释的东西了。
互联网和 Cross Validated 中也有许多示例,其中简单地陈述了对称性假设,没有进一步解释。
Wilcoxon [signed-rank] 检验假设抽样总体是对称的(在这种情况下,中位数和均值相同,此过程成为关于均值和中位数的假设检验,但单样本 t 检验是通常是关于平均值的更强大的测试)。
-- Zar,生物统计学,2010 年第 5 期,第 7.9 节
.
符号检验与此 [Wilcoxon 符号秩] 检验之间的重要区别是对差异分布对称性的附加假设。
...
假设:
- 每个 Di [成对观察的差异] 的分布是对称的。
- Dis是相互独立的。
- Dis都具有相同的意思。
- Dis的测量尺度至少是间隔。
-- Conover,实用非参数统计,1999 年第 3 版,第 5.7 节
然而,我认为@jbowman 和@Glen_b 的回答从不同的角度解释了这个假设。
如果 null 为假,则不一定需要对称性。
...
在某些情况下,假设位置偏移替代方案可能会很方便……但是,这并不能使它成为测试的假设,它使它成为我们出于其他原因所做的附加假设。
-- @Glen_b
.
Wilcoxon 符号秩检验确实要求配对差异来自连续对称分布(在原假设下,正如 Michael Chernick 在评论中指出的那样。)
--@jbowman
我可以总结我的理解的一种方法如下。有符号秩检验的原假设是差值关于一个值对称分布。这个假设有两种可能是错误的。1) 差异可能关于不同的值是对称的。2) 差异可能不对称。如果 #1 是这种情况,则差异的位置与原假设不同,这是一个有用的结果,并且易于解释。如果 #2 是这种情况,那么数据会以一种有用的结果倾斜。这在#1 中可能不太容易解释,但是检查差异的直方图应该可以揭示有关分布的有用信息。
有了这个理解,我认为对原始数据的分布,差异,或者差异的等级没有任何假设。
这听起来如何?
我在这里聚会迟到了,但我正在研究这个问题并想添加一些(希望)有帮助的东西。
在 Gibbons 和 Chakraborti 的 Nonparametric Statistical Inference 第五版中,我发现了这一点:
如果所做的唯一假设是随机样本是从连续分布中抽取的,那么 Wilcoxon 符号秩统计量也可以用作对称性检验……如果接受原假设,我们可以得出结论,总体是对称的并且具有中位数 M 0。但是,如果拒绝原假设,我们就无法判断复合语句 [null and alternative] 的哪个部分(或全部)与样本结果不一致。例如,对于双边替代方案,我们必须得出结论,要么总体是对称的,中位数不等于 M 0,要么总体是不对称的,中位数等于 M 0,或者总体是不对称的,中位数不等于 M 0 .如此宽泛的结论通常不能令人满意,这就是为什么在大多数情况下,证明检验程序的假设与零假设的陈述是分开的。
我认为这有助于加强这里的其他答案,以解释为什么使用这种方法的研究人员认为对称假设是合理的,但不一定希望根据样本数据对其进行正式测试。