理解错误术语

机器算法验证 回归 错误 符号
2022-03-27 17:07:46

我试图弄清楚回归分析中这些不同的“帽子”术语的含义。以下是我的基本理解:

  • Y 总体/样本值的原始值
  • Y^ 回归线
  • β系数,使用总体值
  • β^系数,使用样本值。

但我有一个关于错误术语的问题,是不是:

  1. e (或 ) 误差项,使用总体值, 误差项,使用样本值(因此错误是由于缺少数据引起的)ue^

或者

  1. 是否仅仅表示测量误差(误差是由测量引起的)?e^

此外,有什么方法可以区分作为总体值和作为样本值。YY

1个回答

e是总体误差(的线性组合解释),而的样本部分没有被解释) . 线性回归假设常数,我们应该使用观察到的样本来检查这一点。YXβe^YXβ^eiidN(0,σ2)σ2e^

误差是模型中未包含的的任何变异来源,无论是来自排除变量还是来自测量误差,只要它们符合分布假设即可。Y

我们通常使用来泛指总体,而来指代抽样观察。Yyiith