我最近阅读了一篇论文,其中作者使用 (a) 广义线性模型或 (b) Wilcoxon 秩和检验和 Spearman 秩相关的组合,具体取决于数据是否服从正态分布。他们还在适用时使用了 Bonferroni 校正来解释多重比较。
响应是两个连续变量,每个变量单独分析。他们有 3 个分类变量和 1 个连续变量作为自变量。(a) 对于第一个响应变量,数据服从正态分布,因此 GLM 拟合假设正态分布与身份链接。推断(显然)是通过模型项的显着性做出的,即自变量在模型中是否显着。(b) 对于第二个响应变量,数据不服从正态分布,因此使用 Wilcoxon 秩和检验和 Spearman 秩相关检验。
我的问题是:
1)这两种方法是否合适且同样有效,取决于(非)正态性?
2)即使在非正态性的情况下,不同的 GLM 类型难道不会比 Wilcoxon 秩和检验和 Spearman 秩相关的组合更好吗?(但不确定哪种类型的 GLM 是合适的,因为响应仍然是连续的……也许是伽马?)
3)在 GLM 框架中,我们不担心残差的非正态性,而不是原始数据(这并不总是一回事)吗?
4)具有“正态分布和恒等链接”的GLM(广义线性模型)不是简单的表示一般线性模型(即普通线性模型)吗?
5)这种使用来自完整模型(包括所有变量)的 p 值的方法是否合适,或者变量选择(使用 AIC 或类似方法)是否更合适?