我想知道 wilcoxon 检验与 t 检验有何区别,因此它可以与序数变量一起使用。换句话说,为什么我们不能在测试中使用序数变量,但我们可以使用 wilcoxon 测试?我知道 t 检验和 wilcoxon 检验之间的差异已经得到解答(例如这里),但是没有讨论输入所需的变量类型(例如序数或间隔)的差异。
我在查看此流程图时遇到了这个问题,以选择哪个测试是“最佳”选择:

关于序数变量,wilcoxon 检验与 t 检验有何区别?
简短的回答是,您始终可以使用其中一个测试代替另一个测试——但通常它们会产生不同的结果。这表明问题不在于适用性,而在于适用性。该答案的其余部分讨论了“适用性”可能意味着什么。
SS Stevens 最初(但经常被误解)将测量分类为四种类型——标称、有序、间隔和比率——是基于每种类型所允许的转换组。
学生 t 检验在仿射变换(重新缩放和重新定位)下是不变的,因此适用于其含义不会被仿射变换改变的数据。因此,t 检验的结果不依赖于用于记录数据的测量单位(也不依赖于原始值或“零”值),但如果数据以任何非线性方式转换,它通常会发生变化。
Wilcoxon 检验在任意单调变换(这是一个大得多的变换组)下是不变的:这种变换只需要尊重数据的顺序(较大保持较大,较小保持较小)。因此,Wilcoxon 检验的结果不依赖于用于指定序数数据的数字代码(当然,前提是这些代码尊重排序)。
影响很重要。
首先,这两个测试都适用于可以用(实)数字有意义地表示的任何类型的数据。您始终可以选择使用哪种测试。这种选择需要取决于测试的目的是什么,你可能犯错误的代价是什么,以及数据的统计特征。因此,像问题中所示的流程图不能正确或普遍适用。 (我建议把它扔掉。)
其次,由于数据以非线性方式转换时 t 检验结果会发生变化,因此决定如何最好地记录数据以用于测试目的是至关重要的。 例如,对于正数据(例如浓度),没有先验理由更喜欢使用原始数字或(例如)它们的对数——但是基于原始数字的 t 检验和基于对数的 t 检验将通常会产生不同的结果。由于无知不会使这种现象消失,我们总是需要考虑记录数据的适当方法应该是什么。 (如何找到这种方法是另一个问题,有大量文献和大量技术。)
第三,许多名义数据集不包含以有意义或有用的方式记录数值所需的信息。例如,具有可能值“好”、“更好”和“最佳”的名义变量可以分别编码为 0、1 和 2,或者可能是 0、1 和 10。应该是哪个?由于这两组数字不是以线性方式相关的,因此测试结果可能取决于您选择的数字。如果你想产生可辩护的、非任意的、非主观的结果,这应该是一个问题。 无论您的编码系统如何,使用 Wilcoxon 测试(或任何其他基于等级的测试)都会产生相同的结果,因此可以成为捍卫结果的关键部分。
第四,在存在异常数据或偏态分布的情况下,t 检验可能会产生误导:它不能抵抗意外数据,并且对于偏离分布假设的情况只有一点点稳健。尽管 Wilcoxon 检验做出了分布假设,但它们的限制性往往较小,而且该检验更具抵抗力和稳健性。
第五,如果基本统计假设大致成立,t 检验将比 Wilcoxon 检验(或任何其他基于秩的检验)更强大。 因此,如果您对所做的假设充满信心,那么它在检测重要差异时所需的数据更少(因此成本和时间也更少)可能更胜一筹。
这些含义表明,统计检验的选择不可能简化为简单的流程图。 至少,选择涉及测试的目的、潜在错误的成本、您可以对数据生成过程做出的假设、数据是否与这些假设一致,以及您必须重新调整的灵活性以非线性方式表达数据。