在回归中,更高的调整 R 平方总是更好吗?

数据挖掘 回归
2022-03-04 18:22:33

有点奇怪的问题......我正在尝试组合一个多元回归模型。我将每日温度作为我的控制变量之一。我真的很想控制温度,但有趣的是,移除它似乎会略微增加我调整后的 R 平方(从 0.23 到 0.24 或类似值)。

我从理论上知道,我应该正确删除它,因为它对我的模型没有任何添加?但是考虑到增加是如此之小,而且我很喜欢在我的模型中控制它,保留它是完全错误的吗?如果我把它拿出来,我是否还在“控制”模型中的温度?

1个回答

一般来说,较高的adj。R方更好。在您的情况下,您最好在模型中处理温度的表示。实际上,这取决于数据,但是您可以尝试温度多项式(平方项左右),或者您可以进行“分类”。绘制温度与 y 的关系图,以查看数据中是否存在非线性趋势。如果是这样,您需要尝试在模型中表示此结构,因为 OLS 回归根据定义是参数化的。

调整后的 R 平方平衡了添加新变量的优势和失去自由度的劣势。因此,在您的情况下,温度的解释力似乎对您的模型几乎没有增加。如果您更改变量的表示,这可能会发生变化,以便它更好地适应数据生成过程。你需要尝试。