初学者 Q:残差平方和 (RSS) 和 R2

机器算法验证 回归 残差 线性的 r平方
2022-03-23 03:19:17

我是论坛的新手,并发布了许多问题中的第一个。我正在研究一个线性回归模型,是 0.89,这告诉我我的回归线很合适。当我计算残差平方和时,这个数字大约是 4060,这告诉我预测值和实际值之间的差异很大。R2

= 0.89 和 RSS = 4060 是否相互矛盾?R2

1个回答

不,这些数字并不矛盾。听起来您对的含义有所了解:它代表了模型解释的数据中方差的比例;越接近一,拟合越好。R2

残差平方和 (RSS) 是实际值与预测值之间的平方距离之和:

RSS=i=1n(yiy^i)2

其中是给定的数据点,的拟合值yiy^iyi

您获得的实际数字很大程度上取决于您的响应变量的规模单独来看,RSS 信息量并不大。

示例

将残差想象成一条连接实际值和预测值的垂直线(下图中的红色迹线)。你可以想象,如果你的 y 轴在不同的刻度上,你得到的数字会很不一样。

例如,假设您的 y 轴是公里,给定点距离您的最佳拟合线大约 0.5 公里。然后,该给定数据点的残差为 0.5。但是,如果您的比例是米,那么同一个数据点的残差为 500。您的 RSS 会大得多,但拟合完全没有变化;事实上,数据也根本没有改变。但是 RSS 发生了巨大的变化。

RSS 随规模变化