当您模拟数据时,您知道总体系数,因为您选择了它们。但是如果我模拟数据并且只给你数据,你不知道人口系数。你只有数据——就像真实数据一样。
当您查看具有线性关系噪声的数据时,有多种与数据一致的总体线——可以合理地产生该数据的线:

三个标记的线都是合理的人口线 - 观察到的数据可能很容易来自这些线中的任何一条(以及靠近这些线的无数其他线)。
但是如果我们减小误差项的标准差:

那么可能产生该数据的线的斜率和截距范围要小得多;虽然与第二组数据一致的所有行都可以产生第一组数据,但有些行很容易产生第一组数据,而对于第二组数据来说相对不可信。从字面上看,对于第二组数据,您对人口线可能在哪里的不确定性较小。
或者这样看:如果我模拟 50 个样本,比如左手(灰色)点(全部具有相同的系数并且具有更大的σ),那么拟合回归线的系数将因样本而异。如果我然后对较小的做同样的事情σ,它们的变化相应较小。
在这里,我们为大小为 100 的 50 个样本中的每一个绘制斜率与截距,对于大样本和小样本σ:

事实上,我们看到第二组点(拟合系数)的变化要小得多。如果您对许多这样的样本执行此操作,则结果表明,在任何方向上点到中心的典型距离与σ.
如何更大的传播x' 使标准误差更小?
考虑这两个图,我将较大的噪声样本分成接近 x 均值的点和更远的点(这使得 x 的标准偏差相对较小和较大):

现在只考虑斜率。
从这个大的中心半部分看子集中的点-σ数据集,我们可以看到,可能产生该数据的斜率范围比合理产生值的外半部分的斜率范围更广——与人口线的分布相比,人口线的点分布相对更宽x 的,所以如果 x 传播很窄,那么斜率就有更多的“摆动空间”。
具体来说,两条红线与点的中半部分非常一致,但与外半部分不一致(任何一条线都不太可能产生右侧图中的点)。