机器算法验证 - 通过原点回归 - 吾爱随笔录

机器算法验证回归截距

2022-03-21 03:40:01

我们有以下几点：

(0, 0) (1, 51.8) (1.9, 101.3) (2.8, 148.4) (3.7, 201.5) (4.7, 251.1) (5.6, 302.3) (6.6, 350.9) (7.5, 397.1) (8.5, 452.5) (9.3, 496.3)

$(0,0)(1,51.8)(1.9,101.3)(2.8,148.4)(3.7,201.5)(4.7,251.1) \\ (5.6,302.3)(6.6,350.9)(7.5,397.1)(8.5,452.5)(9.3,496.3)$ 我们如何才能找到最佳拟合线

y = a x

$y=ax$ 通过积分？我的计算器可以选择找到最佳拟合线

y = a x + b

$y=ax+b$ 通过这几点，即：

y = 53.28 x + 0.37

$y = 53.28x + 0.37$

我怎样才能找到最合适的配件 $y=ax$ ? 在我看来，我们不能只删除 $0.37$ 在不补偿的情况下 $a$ ?

2个回答

当截距被抑制时，斜率的普通最小二乘估计为：

\hat{β} = \frac{\sum_{i = 1}^{N} x_{i} y_{i}}{\sum_{i = 1}^{N} x_{i}^{2}}

$\hat{\beta}=\frac{\sum_{i=1}^N x_iy_i}{\sum_{i=1}^N x_i^2}$

@gung 给出了 OLS 估计值。这就是你所寻求的。

但是，在处理线必须通过原点的物理量时，误差的大小通常会随着 x 值的变化而变化（大致具有恒定的相对误差）。在这种情况下，普通的未加权最小二乘法是不合适的。

在这种情况下，一种方法（有几种可能性）是取对数，从 y 中减去 x，并通过差异的平均值估计（原始变量的）对数斜率。

或者，可以使用加权最小二乘。在相对误差恒定的情况下，将减少为使用估计器 $\hat{\beta}=\frac{1}{N}\sum_{i=1}^N \frac{y_i}{x_i}$ （通过原点的所有斜率的平均值）。

还有其他方法（例如 GLM），但如果你是在计算器上做的，我会倾向于我的第一个建议。

您还应该考虑您所做的任何假设的适当性。

我认为通过原点添加 WLS 线的推导可能是有益的，然后我的“平均斜率”和 gungs OLS 是特殊情况：

模型是 $y_i=\beta x_i+\varepsilon_i\,,$ 在哪里 $\text{Var}(\varepsilon_i)=w_i\sigma^2$

我们想最小化 $S = \sum_i w_i(y_i-\beta x_i)^2$

$\frac{\partial S}{\partial \beta} = -\sum_i 2x_i.w_i(y_i-\beta x_i)$

设置为零以获得 LS 解 $\hat{\beta}$ 我们获得 $\sum w_ix_iy_i = \hat{\beta} \sum w_ix_i^2$ ，或者 $\hat{\beta}=\frac{\sum w_ix_iy_i}{\sum w_ix_i^2}$ .

什么时候 $w_i\propto 1$ 对全部 $i$ ，这产生了gung的OLS解决方案。

什么时候 $w_i \propto 1/x_i^2$ （这对于散布随平均值增加的情况是最佳的），这会产生上述“斜率平均值”解决方案。

其它你可能感兴趣的问题