R平方何时为负?

机器算法验证 回归 spss r平方
2022-01-18 12:52:52

我的理解是不能为负,因为它是 R 的平方。但是我在 SPSS 中使用单个自变量和因变量进行了简单的线性回归。我的 SPSS 输出给我一个负值如果我要从 R 手动计算,那么将是正数。SPSS 做了什么来将其计算为负数?R2R2R2

R=-.395
R squared =-.156
B (un-standardized)=-1261.611

我用过的代码:

DATASET ACTIVATE DataSet1. 
REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA 
           /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN 
           /DEPENDENT valueP /METHOD=ENTER ageP

我得到一个负值。谁能解释这意味着什么?

负 R 平方

在此处输入图像描述

3个回答

R2将所选模型的拟合与水平直线(原假设)的拟合进行比较。如果所选模型的拟合比水平线差,则为负数。请注意,并不总是任何事物的平方,因此它可以具有负值而不违反任何数学规则。才为负数,因此比水平线更适合。R2R2R2

示例:将数据拟合到受约束的线性回归模型,使得截距必须等于Y1500

在此处输入图像描述

鉴于这些数据,该模型毫无意义。这显然是错误的模型,也许是偶然选择的。

模型的拟合(一条被约束通过点 (0,1500) 的直线)的拟合比水平线的拟合差。因此模型的平方和大于水平线的平方和(SSres)(SStot)

R2计算为(这里, = 残差。)大于的负值1SSresSStotSSres
SSresSStotR2

对于没有约束的线性回归,必须为正(或零)并且等于相关系数的平方。只有当截距或斜率受到约束以使“最佳拟合”线(给定约束)比水平线拟合得更差时,线性回归才有可能出现对于非线性回归,只要最佳拟合模型(给定所选方程及其约束,如果有)拟合数据比水平线差R2rR2R2

底线:不是数学上的不可能或计算机错误的迹象。它只是意味着所选模型(及其约束)与数据的拟合非常差。R2

您是否忘记在回归中包含截距?我不熟悉 SPSS 代码,但在 Hayashi 的计量经济学的第 21 页:

如果回归量不包括常数,但(如一些回归软件包那样),您仍然可以通过公式R2

R2=1i=1nei2i=1n(yiy¯)2

那么可以是负数。这是因为,如果没有截距的好处,回归在跟踪因变量方面可能比样本均值更差(即,分子可能大于分母)。R2

我会检查并确保 SPSS 在您的回归中包含一个截距。

如果您有一个 Niid 的时间序列并且您构建了一个不合适的 ARIMA 模型(0,1,0),这是一个没有漂移的一阶差分随机游走模型,然后是方差(平方和 - SSE),就会发生这种情况的残差将大于原始序列的方差(平方和 SSO)。因此等式 1-SSE/SSO 将产生一个负数,因为 SSE execeedS SSO 。当用户简单地拟合假设模型或使用不充分的程序来识别/形成适当的 ARIMA 结构时,我们已经看到了这一点。更大的信息是模型可以扭曲(很像一副坏眼镜)你的视力。如果无法访问您的数据,否则我在解释您的错误结果时会遇到问题。您是否已引起 IBM 的注意?

假设模型适得其反的想法得到了 Harvey Motulsky 的回应。伟大的职位哈维!