我有一个测量数据集(非正态分布)。该数据集的每一行都由同一变量在特定时间(即 XYY [time, meas1, meas2])的两个测量值组成。该数据集包含 24 行。
使用 Wilcoxon 符号秩检验比较这两个测量值是否正确?使用此测试来比较不同实验之间这些测量值的平均值是否正确?
谢谢
我有一个测量数据集(非正态分布)。该数据集的每一行都由同一变量在特定时间(即 XYY [time, meas1, meas2])的两个测量值组成。该数据集包含 24 行。
使用 Wilcoxon 符号秩检验比较这两个测量值是否正确?使用此测试来比较不同实验之间这些测量值的平均值是否正确?
谢谢
一个主要问题是差异是否存在连续依赖性,因为观察是随着时间的推移。该测试假定独立,如果不成立,它可能会受到严重影响。[我的其余答案基于独立性足够接近真实,以至于检验统计量的零分布不会受到严重影响。]
如果您想检验零假设,即测量对具有相同的分布而不是它们不具有相同分布,则 Wilcoxon 符号秩检验将是合适的(还有一些其他假设对适合该检验)。
如果您想专门测试均值差异的替代方案,则该测试将对该差异敏感(在相同分布为零的情况下),但它给出的位置偏移估计不是均值的偏移(它是 Hodges -Lehmann 估计,成对差异的中位数;如果你喜欢它是中位数偏移)。如果您的备选方案明确是移位备选方案,则 Hodges-Lehmann 估计将是成对转变的总体均值的合理估计量。
(简而言之,如果我理解您的描述,那么是的,看起来签名等级测试是合适的,但是要推断出您必须做出额外假设的手段。)
如果您对差异的平均值特别感兴趣,我建议您查看置换测试;通过合理有效的实现,您的样本足够小以涵盖所有可能的排列。
我也一直在想这个。事实证明,这个问题最近出现了几次:
@Glen_b 指出数据中的自相关(例如,读数及时接近值接近的趋势)打破了 Wilcoxon 符号秩检验的中心假设,即这些对在您的数据中是独立的。
换句话说,如果您的 100 个配对读数随着时间的推移高度相关(通常是这种情况),那么您不是在测试 100 个独立配对。您的有效样本量要小得多。如果在时间 1 观察 A >> 观察 B,则在时间 2、时间 3 等可能也是如此……取决于数据中的自相关水平。
现在 Wilcoxon 出现并看到 100 个独立样本,它们都具有属性 A >> B。宾果游戏!A 与 B 不同,具有非常高的统计显着性。但实际上,如果您再次运行测试,您可能会发现在时间 1,这会像以前一样及时向前传播。Wilcoxon 现在说 A 和 B 具有相同的分布。
所以,在解决了这一点之后,我现在承认我不知道如何处理它! 最近的一项研究对测试进行了修改以处理聚类数据。例如左眼 - 右眼(之前和之后)测试。但是我们的问题只有一个“集群”——一个时间序列——所以我认为这不会有帮助。