这只是我遇到过几次的例子,所以我没有任何样本数据。在 R 中运行线性回归模型:
a.lm = lm(Y ~ x1 + x2)
x1是一个连续变量。x2是分类的,具有三个值,例如“低”、“中”和“高”。然而,R 给出的输出类似于:
summary(a.lm)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.521 0.20 1.446 0.19
x1 -0.61 0.11 1.451 0.17
x2Low -0.78 0.22 -2.34 0.005
x2Medium -0.56 0.45 -2.34 0.005
我知道 R 对这些因素(x2作为一个因素)引入了某种虚拟编码。我只是想知道,我如何解释x2值“高”?例如,“High”x2对此处给出的示例中的响应变量有什么影响?
我在其他地方(例如这里)看到过这样的例子,但没有找到我能理解的解释。