机器算法验证 - 为什么截距的标准误会越来越大X¯x¯从 0 开始？ - 吾爱随笔录

为什么截距的标准误会越来越大X¯x¯从 0 开始？

机器算法验证回归解释标准错误

2022-01-26 12:17:30

截距项的标准误 ( $\hat{\beta}_0$ ）在 $y=\beta_1x+\beta_0+\varepsilon$ 是（谁）给的

S E ({\hat{β}}_{0})^{2} = σ^{2} [\frac{1}{n} + \frac{{\bar{x}}^{2}}{\sum_{i = 1}^{n} (x_{i} - \bar{x})^{2}}]

$SE(\hat{\beta}_0)^2 = \sigma^2\left[\frac{1}{n}+\frac{\bar{x}^2}{\sum_{i=1}^n(x_i-\bar{x})^2}\right]$ 在哪里

\bar{x}

$\bar{x}$ 是的平均值

x_{i}

$x_i$ 的。

据我了解，SE 量化了您的不确定性——例如，在 95% 的样本中，间隔 $[\hat{\beta}_0-2SE,\hat{\beta}_0+2SE]$ 将包含真实的 $\beta_0$ . 我无法理解 SE（一种不确定性的度量）如何随着 $\bar{x}$ . 如果我只是简单地转移我的数据，那么 $\bar{x}=0$ ，我的不确定性下降了？这似乎不合理。

一个类似的解释是 - 在我的数据的非中心版本中， $\hat{\beta}_0$ 对应于我的预测 $x=0$ ，而在居中的数据中， $\hat{\beta}_0$ 对应于我的预测 $x=\bar{x}$ . 那么这是否意味着我对我的预测的不确定性 $x=0$ 大于我对我的预测的不确定性 $x=\bar{x}$ ? 这似乎也不合理，错误 $\epsilon$ 对于的所有值具有相同的方差 $x$ ，所以我的预测值的不确定性应该对所有人都相同 $x$ .

我敢肯定，我的理解存在差距。有人可以帮我理解发生了什么吗？

1个回答

因为由普通最小二乘法拟合的回归线必然会通过数据的平均值（即， $(\bar x, \bar y)$ )——至少只要你不抑制截距——关于斜率真实值的不确定性对直线在平均值处的垂直位置没有影响 $x$ （我吃 $\hat y_{\bar x}$ ）。这转化为较小的垂直不确定性 $\bar x$ 比你离得更远 $\bar x$ 你是。如果拦截，在哪里 $x=0$ 是 $\bar x$ ，那么这将最大限度地减少您对真实值的不确定性 $\beta_0$ . 在数学术语中，这转化为标准误差的最小可能值 $\hat\beta_0$ .

这是一个简单的例子R：

set.seed(1)                           # this makes the example exactly reproducible
x0      = rnorm(20, mean=0, sd=1)     # the mean of x varies from 0 to 10
x5      = rnorm(20, mean=5, sd=1)
x10     = rnorm(20, mean=10, sd=1)
y0      = 5 + 1*x0  + rnorm(20)       # all data come from the same  
y5      = 5 + 1*x5  + rnorm(20)       #  data generating process
y10     = 5 + 1*x10 + rnorm(20)
model0  = lm(y0~x0)                   # all models are fit the same way
model5  = lm(y5~x5)
model10 = lm(y10~x10)

在此处输入图像描述

这个图有点忙，但是你可以看到几个不同研究的数据，其中的分布 $x$ 离得更近或更远 $0$ . 斜率因研究而异，但大体相似。（请注意，它们都经过我用来标记的带圆圈的 X $(\bar x, \bar y)$ .) 尽管如此，关于这些斜率真实值的不确定性导致了关于这些斜率的不确定性 $\hat y$ 扩大你得到的距离 $\bar x$ , 意味着 $SE(\hat\beta_0)$ 对于在 $x=10$ ，并且对于数据在附近采样的研究来说非常狭窄 $x=0$ .

编辑以回应评论： 不幸的是，如果您想知道可能的情况，在获得数据后将数据居中将无济于事 $y$ 一些价值 $x$ 价值 $x_\text{new}$ . 相反，您首先需要将数据收集集中在您关心的点上。为了更全面地理解这些问题，它可能会帮助您在这里阅读我的答案：线性回归预测区间。

其它你可能感兴趣的问题

上一篇为什么 PCA 最大化投影的总方差？下一篇stl 和 decompose 哪个更好？