考虑最小二乘拟合线时,标准偏差的等价物是多少?

机器算法验证 线性模型 公差区间
2022-04-08 02:43:22

我正在计算以下http://www.itl.nist.gov/div898/handbook/prc/section2/prc253.htm的容差区间,但这表示将 k 值乘以样本的标准偏差。我有一个带有拟合线的模型,所以我想我不想使用标准偏差,而是使用一些反映残差的值,而不是使用样本均值,我将使用线性回归的预测值模型。那正确吗?我用什么值代替标准差?

我可以(也许应该)这样问这个问题:给定一个线性模型,我如何计算单边公差区间。基于此,我认为容忍间隔对我的问题是正确的:http ://www.kmjn.org/notes/tolerance_intervals.html

再次编辑:我找到了这个公式“假设线性函数并且没有重复,关于回归的标准偏差”(来自这里

回归公式的标准差

这是得到一个值乘以 k 值的正确公式吗?

1个回答

由于现在提出了问题,您正在寻找与适当表 k 相乘的标准偏差,以预测给定 x 的 y 的单边公差区间。适当的标准偏差是给定 x 的 y 的预测估计的标准偏差,而不是残差的标准偏差。正确的标准偏差是通过对给定 x 的拟合 y 取方差并添加一个残差方差估计值并取平方根来获得的。这是因为预测与拟合值相同,但给定 x 处的新 y 的实际值与“真实”模型的不同之处在于一个独立的误差项。因此,要考虑到残差方差必须添加到给定 x 的“真实”y 与适合它的模型之间的差异的方差中。

从 Chernick 2011 “The Essentials of Biostatistics for Physicians, Nurses, and Clinicalians” pp. 102-103 中得到的公式如下:

SSx = ∑(Xi- Xb)2其中 Xb= ∑Xi/n

SSE = ∑(Yi-是的b)2其中 Yb= ∑Yi/n

那么估计的标准误为 Sy.x=√[SSE/(n-2)]。

接下来,在给定 X=x 的情况下,拟合 Y 的标准误差如下:

SE(Y^) = Sy.x√[(xXb)2/SSx+1/n​​] 但是为了预测,我们需要再添加一个 Sy.x2项来获得预测的方差。因此,在给定 X=x 的情况下,预测 Y 的标准误差为:

SE(Ypred)= 小号y.x√[1+(xXb)2/SSx+1/n​​]。

您需要的常数将是您指定的置信水平和覆盖范围的单边高斯置信区间的常数。这些表格可以在 Hahn 和 Meeker 的统计间隔书中找到。