分类变量的加权回归

机器算法验证 回归 方差分析 残差 加权回归
2022-04-13 09:21:52

我一直在尝试对一些具有三个分类变量的数据使用加权回归

lm(y ~ A*B*C) 

R中的命令。

这是为了尝试解决我的残差图没有恒定方差的问题,并且对于一个因素,两个级别的方差远小于另一个级别和其他因素,所以我定义了权重,在向量 ww 中,对于每个观测值,使得相应观测值的贡献不及另一个观测值,并使用

lm(y ~ A*B*C, weights=ww)

我的问题是,当我使用权重时,我得到的残差与不使用权重时完全相同。这应该发生吗?是因为所有变量 A、B、C 都是分类变量吗?

这似乎有点道理,因为回归系数(线性模型中的 beta)只是未加权模型中与参考均值的均值和差异,我认为使用加权回归也是如此,但我不确定。

谁能帮我这个?我有点失落。即有人可以告诉我是否不应该使用加权最小二乘法来解决残差异构方差的问题?(我也尝试过转换响应变量,它有帮助但没有解决问题。 log(y)

1个回答

您不应该手动定义权重。使用 nlme 中的 gls 函数(请参阅帮助,您可能需要选项 weights = varIdent(form = ~ 1 | group) )来估计权重,然后使用 Pearson 残差(将原始残差除以预期/拟合方差)来检查模型。