对离散和配对数据进行适当测试

机器算法验证 t检验 离散数据 配对数据 威尔克森符号秩
2022-03-14 23:34:11

我来回做哪些测试。我有两个成对的变量,它们都是正整数(0,1,2,3...等)。n=559. 变量表示由两种不同方法产生的误差。我想知道使用方法 1 是否得到最小的误差。我转向配对 t 检验,这需要两个变量之间差异的正态性。但是当数据是离散的时候甚至可以使用它吗?直方图(正态分布绘制在顶部)和qqplot可以在附图中看到。作为替代方案,我研究了 wilcoxon 符号等级测试——这会更合适吗?

对于任何错误的陈述,我都会提前申请——我不是统计学家。

到配对变量之间的差异

1个回答

只是为了扩展为什么 t 检验有效:这是中心极限定理的结果,它告诉我们样本均值具有正态分布n成长。您的数据显然是非正态的,仅采用离散值,但由于您的样本量大,样本均值将是相当正态分布的。

如果您的样本量小得多,那么 Wilcoxon 符号秩检验会更合适,避免使用正态假设。