使用偏移量时的 R 平方值——它是如何计算的?

机器算法验证 r 回归 最小二乘 r平方 抵消
2022-04-09 05:20:12

我有一个线性模型,其中测试分数变量作为因变量和协变量向量。我在模型中有一个偏移变量。

所以公式是=

scorei=B0+BxXx+offseti+ei

或等效地:

scoreioffseti=B0+BxXx+ei

我在 R 中使用

lm(score ~ covariates, offset=offset, data=data)

运行此程序时,我得到R20.55

然后,我创建一个不同的因变量,手动减去偏移量,所以公式是:

score-offseti=B0+BxXx+ei

我得到不同的 - 大大减少:R20.10

我想知道为什么这些计算不同。显然,这是一个很大的区别。Ripley 教授在这里http://r.789695.n4.nabble.com/Calculation-of-r-squared-for-linear-model-with-offset-td797608.html指出在存在时的计算方式不同偏移量,但我不确定如何。 R2

1个回答

R2是根据拟合值的平方和(假设存在截距项)和平方和残差MSS=(y^iy¯i)2RSS=(yiy^i)2

R2=MSSMSS+RSS:

它是拟合“解释”的总平方和的分数。无论是减去偏移量还是在参数中将其声明为变量,模型都是等价的——它产生相同的残差——但在前一种情况下,要预测的值是的值;也就是说,已从中减去。 当手动减去偏移量时,要“解释”的平方和因此会发生变化(并且软件无法知道这一点)。可以增加或减少,分别导致增加或减少。zioffsetyiziziy^iMSSR2