LR模型摘要中的NA(R)

数据挖掘 r 线性回归
2022-02-11 19:53:17

所以,我试图改进在数据集上执行多元线性回归的 mr LR 模型。我有一个分类变量区域

地区(变量):中西部 东北 西南

我为他们每个人都做了虚拟变量,它确实改进了我的模型。

以前的模型摘要 在此处输入图像描述

添加这些变量后(我使用不同的变量) 在此处输入图像描述

我在西方的系数中得到了 NA,我不明白为什么。有人可以解释吗?

1个回答

您已经给所有四个区域一个虚拟变量,所以这些是完全多重共线性的,并且(未惩罚?)回归没有唯一的解决方案。在这种情况下,R 会自动删除一列并报告NA.

https://stats.stackexchange.com/q/212903/232706
https://stackoverflow.com/q/7337761/10495893
https://stats.stackexchange.com/q/25804/232706

(您可以看到 R 在哪里调用 C 以及随后的 FORTRAN 函数,然后在
https://github.com/wch/r-source/blob/0f07757ad10ca31251b28a2c332812e63c0acf38/src/library/stats/R/lm.R#L117
A处插入 NA帮助我发现的好文章:http: //madrury.github.io/jekyll/update/statistics/2016/07/20/lm-in-R.html