如何根据数据不确定性计算线性回归斜率的不确定性(可能在 Excel/Mathematica 中)?
示例: 让我们有数据点 (0,0), (1,2), (2,4), (3,6), (4,8), ... (8, 16),但每个 y 值都有不确定性为 4。我发现的大多数函数会将不确定性计算为 0,因为这些点与函数 y=2x 完全匹配。但是,如图所示,y=x/2 也与点匹配。这是一个夸张的例子,但我希望它表明我需要什么。
编辑:如果我尝试多解释一点,虽然示例中的每个点都有特定的 y 值,但我们假装我们不知道它是否属实。例如,第一个点 (0,0) 实际上可能是 (0,6) 或 (0,-6) 或介于两者之间的任何值。我问在任何流行的问题中是否有考虑到这一点的算法。在示例中,点 (0,6), (1,6.5), (2,7), (3,7.5), (4,8), ... (8, 10) 仍然落在不确定范围内,所以它们可能是正确的点,连接这些点的线有一个方程:y = x/2 + 6,而我们不考虑不确定性得到的方程有方程:y=2x + 0。所以 k 的不确定性是 1,5,n 是 6。
TL;DR:在图片中,有一条线 y=2x 是使用最小二乘拟合计算的,它完美地拟合了数据。如果我们知道 y 值的不确定性,我试图找出 y=kx + n 中的 k 和 n 可以改变多少,但仍然适合数据。在我的示例中,k 的不确定性为 1.5,在 n 中为 6。在图像中有“最佳”拟合线和一条几乎不适合点的线。