我被问到夏皮罗-威尔克测试中的 I 类错误是否会影响主要分析,以及如果我的数据是正态分布的,是否使用了错误的测试是否重要......
如果我对正态分布数据使用非参数检验会发生什么?
机器算法验证
非参数
2022-03-17 09:50:20
2个回答
在统计分析中,如果您的数据遵循参数分布,您应该利用了解分布的好处,并采用基于该分布的统计方法。
但有时我们不知道随机变量的分布,因此开发了非参数统计方法以涵盖广泛的分布,同时牺牲一些效率。
已知随机变量的分布,使用非参数统计方法,而不是基于知道分布的参数统计方法,效率低下,即检验的功效会降低,标准误差会增加,置信区间会增加比参数方法更宽。
如果您的数据碰巧来自正常人群(并且适用于普通 t 检验的其他常见假设),那么该测试将正常工作(它是非参数的,它应该有效)。这个分数没有戏剧性。
如果你足够了解你有信心假设正常,你可能想利用这些知识,但对于许多测试来说,它对你没有多大帮助。
如果您正在执行一种常见的位置测试(Wilcoxon 符号秩测试、Wilcoxon-Mann-Whitney 测试),那么您在忽略正态性的位置偏移测试中几乎没有损失任何东西(功率方面)。[当所有假设都成立时,每 21 个观测值需要一个额外的观测值来匹配最强大检验的功效。]
如果您正在处理其他一些测试,可能会更重要(尽管有些可能更不重要)。与随机区组设计中的相应 ANOVA 检验相比,它产生更大差异的一个示例是使用弗里德曼检验。
其它你可能感兴趣的问题