如果您的回归残差不是正态分布、无法转换并且即使移除异常值也不符合,该怎么办?

机器算法验证 非参数 残差 咕噜咕噜
2022-03-27 02:45:45

我对 R 进行了回归,我的 shapiro wilk 测试表明我的一些残差通常不会被分配。我无法转换数据以适应正态分布,即使我删除了异常值,我的数据仍然不符合?我认为这是因为有很多零,然后偶尔会出现大量的鱼群,这意味着我的数据非常奇怪。希望有任何建议。

我的响应变量是鱼类密度和物种丰富度我的预测变量是所有类别、深度(5、10 和 15m)和地点(1、2 3)和采样方法(1、2)。

我还考虑过使用 wilcoxson 符号等级来比较密度和丰富度,但我只能在两个站点之间执行此操作,因为我的其他预测器有 3 个级别。

谢谢。

在此处输入图像描述

1个回答

2条路径:

  • 零膨胀模型

  • 基于秩的非参数方差分析

在他的位置,我会在计数上运行 Krukal Wallis 方差分析 ~ 类别,不需要残差和异方差的两个方差分析假设正态性。此外,如果我想要一个回归模型,我会使用零膨胀泊松,因为它是一个生态计数数据(稀疏性),最后,如果更多,数据过度分散,我会查看零膨胀二项式模型。无论如何,我会根据对数似然比较 ZIP 和 ZINB(AIC,BIC 也是......)