如何推导线性回归系数的标准误

机器算法验证 标准错误 推理
2022-01-24 22:10:28

对于这个单变量线性回归模型

yi=β0+β1xi+ϵi
给定数据集D={(x1,y1),...,(xn,yn)},系数估计为
β^1=ixiyinx¯y¯nx¯2ixi2
β^0=y¯β^1x¯
这是我的问题,根据这本书和维基百科,标准错误β^1
sβ^1=iϵ^i2(n2)i(xix¯)2
如何以及为什么?

2个回答

上面的第三条评论:我已经明白它是怎么来的。但还有一个问题:在我的帖子中,标准误差有(n-2),根据你的回答,它没有,为什么?


我的帖子中,发现

se^(b^)=nσ^2nxi2(xi)2.
分母可以写成
ni(xix¯)2
因此,
se^(b^)=σ^2i(xix¯)2

σ^2=1n2iϵ^i2
即方差分析表中的均方误差 (MSE),我们最终得到您的表达式se^(b^). n2项说明在估计截距和斜率时损失了 2 个自由度。

另一种思考 n-2 df 的方式是因为我们使用 2 个均值来估计斜率系数(Y 和 X 的均值)

来自 Wikipedia 的 df :“...一般来说,参数估计的自由度等于进入估计的独立分数的数量减去在参数本身估计中用作中间步骤的参数数量。”