为什么多元回归的自由度为 n - k - 1?对于线性回归,为什么是 n - 2?

机器算法验证 多重回归
2022-03-20 21:58:35

我正在读一本教科书,我看到了这个问题:

在此处输入图像描述

所以有 200 名女性,DF 是 196,这意味着 DF 的方程是有 3 个变量:bp、年龄和类型,所以这背后的直觉是什么?nk1k==3

另外,为什么线性回归的自由度是 n - 2?

在此处输入图像描述

2个回答

在线性回归中,残差的自由度为:

df=nk

其中是您估计的参数数量,包括截距。(残差向量将存在于线性空间中。)knk

如果您在回归中包含截距项,并且指的是不包括截距的回归量的数量,则kk=k+1

笔记:

  • 它因统计文本等而异……如何,是否包括截距项。)k
  • 符号不是标准的。k

例子:

简单的线性回归:

在最简单的线性回归模型中,您正在估计两个参数:

yi=b0+b1xi+ϵi

人们通常将此称为因此,我们正在估计参数。剩余自由度为k=1k=k+1=2n2

您的教科书示例:

您有 3 个回归量(bp、类型、年龄)和一个截距项。您正在估计 4 个参数,剩余自由度为n4

如果我有次观察,数据可能有种方式,但假设我正在估计 3 个变量(包括截距),那么实际上它可能只有种方式,因为我已经估计了 3 种控制事物数据。这就是我看待它的方式nn(n3)