为什么回归中预测区间的末端更宽?
机器算法验证
预测区间
2022-04-18 20:08:34
3个回答
执行线性回归时,预测中有两种类型的不确定性。
首先是对估计的整体平均值的预测(即拟合的中心)。二是估计计算斜率的不确定性。
因此,当您结合预测的两种不确定性时,高估计值和低估计值之间存在差异。然后随着远离中心,斜率的不确定性成为一个更大且更明显的因素,因此限制扩大了。
希望这能回答你的问题。
确定数据的预测区间非常容易。
如您所见,这是 x 中的二次函数,这意味着对于较大的值(嗯......与样本平均值相比更大),预测的方差会更大。
例如,该参考资料清楚地给出了简单线性回归模型的预测区间公式,其中包含以下表达式:
所以,作为解释变量的预测变得更加远离它的平均值,区间变宽。
在实践中,我会谨慎地应用远离平均值的预测区间,特别是未包含在观察到的数据范围内的点估计,因为结构方程本身可能不再准确/有效。
