从我的结果来看,GLM Gamma 似乎符合大多数假设,但它是否比对数变换的 LM 值得改进?我发现的大多数文献都涉及泊松或二项式 GLM。我发现文章EVALUATION OF GENERALIZED LINEAR MODEL ASSUMPTIONS USING RANDOMIZATION非常有用,但它缺乏用于做出决定的实际图。希望有经验的人能给我指出正确的方向。
我想对响应变量 T 的分布进行建模,其分布如下图所示。如您所见,这是正偏度:
.
我有两个分类因素需要考虑:METH 和 CASEPART。
请注意,这项研究主要是探索性的,本质上是在对模型进行理论化并围绕它执行 DoE 之前作为试点研究。
我在 R 中有以下模型及其诊断图:
LM.LOG <- lm(log10(T) ~ factor(METH) + factor(CASEPART),
data=tdat)
GLM.GAMMA <- glm(T ~ factor(METH) * factor(CASEPART),
data=tdat, family="Gamma"(link='log'))
GLM.GAUS <- glm(T ~ factor(METH) * factor(CASEPART),
data=tdat, family="gaussian"(link='log'))
我还通过 Shapiro-Wilks 残差检验获得了以下 P 值:
LM.LOG: 2.347e-11
GLM.GAMMA: 0.6288
GLM.GAUS: 0.6288
我计算了 AIC 和 BIC 值,但如果我是正确的,由于 GLM/LM 中的不同家族,它们并不能告诉我太多。
此外,我注意到了极端值,但我不能将它们归类为异常值,因为没有明确的“特殊原因”。