这是一个一般性的,也许是基本的问题,但它会帮助我避免错误。为了使用参数检验(t 检验,ANOVA)来检验连续变量对标称的依赖性,“数据必须是正态分布的”(分布必须与正态分布相差不大)。
但我不太清楚:我必须一起测试连续数据的正态性(整个样本)还是每一组数据的正态性?
如果我的组规模较小(n=4-6),因此我无法拒绝 null,这是否表示允许使用参数方法?
谁能给我提供一些使用 R 进行统计(生物医学)假设检验的好例子的链接(谷歌没有帮助)?
这是一个一般性的,也许是基本的问题,但它会帮助我避免错误。为了使用参数检验(t 检验,ANOVA)来检验连续变量对标称的依赖性,“数据必须是正态分布的”(分布必须与正态分布相差不大)。
但我不太清楚:我必须一起测试连续数据的正态性(整个样本)还是每一组数据的正态性?
如果我的组规模较小(n=4-6),因此我无法拒绝 null,这是否表示允许使用参数方法?
谁能给我提供一些使用 R 进行统计(生物医学)假设检验的好例子的链接(谷歌没有帮助)?
通常是需要正态分布的残差。这意味着每个组都是正态分布的,但是您可以对残差(值减去组平均值)作为一个整体进行诊断,而不是逐组进行诊断。有可能(甚至很常见)每个组中的数据大致正常,但由于组意味着不同,因此整个数据集将非常不正常,但您仍然可以对这种情况使用正常的理论测试。
请注意,真正的问题不是“完全正常”,而是“对于给定问题足够正常”。对于小数据集,正态性问题是最重要的,但是您检测非正态性的能力很低(除非它非常极端),对于大数据集,中心极限定理会发挥作用,因此您的数据不需要那么正常,但是您有很大的能力来检测与正常情况的微小偏差。因此,当将正态性的正式测试作为进行 t 检验或方差分析的条件时,您要么处于对有意义的问题没有意义的答案,要么对无意义的问题有有意义的答案(可能有一些中间两者都有意义的大小,但我希望中间范围确实是两者都没有意义的地方)。
因此,不只是因为小样本量不拒绝零值并不意味着使用正态理论方法是安全的。关于数据来源和一些诊断图的知识可能在该决定中更有用,或者如果您担心非正态性,则直接进行非参数检验。
如果您真的觉得需要 p 值测试精确正态性,那么您可以使用 R 包中的SnowsPenultimateNormalityTest
函数TeachingDemos
(但请务必阅读帮助页面)。
如果您需要的不仅仅是诊断图,另一个测试“足够正常”的选项是使用以下方法:
Buja, A., Cook, D. Hofmann, H., Lawrence, M. Lee, E.-K., Swayne, D.F and Wickham, H. (2009) Statistical Inference for exploratory data analysis and model diagnostics Phil. Trans. R. Soc. A 2009 367, 4361-4383 doi: 10.1098/rsta.2009.0120
(包中的vis.test
函数是这个的一种实现)。TeachingDemos
R
要带走的重要一点是,关于生成数据的过程的知识比某些程序/算法的输出要重要得多,这些程序/算法是由比你了解/了解你的数据和问题的人少得多的人编写的。
@GregSnow 在这里有一个非常好的答案,我想用 2 个小点来补充。首先,虽然他是对的,只有残差的正态性很重要,但我们可以问“有什么关系”这个问题?每个接受过 101 统计的人都会留下这样的印象,即正常是至关重要的,而这并不是真的。高斯-马尔可夫定理告诉我们我们的数据不必是正常的;它们应该是对称的和同质的。残差的正态性仅与准确的置信区间/ p 值相关,即使如此,也仅在样本量较小时才真正需要(正如@GregSnow 指出的那样)。当获得方差同质性时,无论残差是否为正态分布,估计都将是无偏且有效的。我的第二个小补充是,小样本和非正态残差可能不需要非参数测试——自举也是一个可行的选择。