机器算法验证 - 将一个回归的残差与另一个回归的残差作图能给我们带来什么？ - 吾爱随笔录

将一个回归的残差与另一个回归的残差作图能给我们带来什么？

机器算法验证回归残差

2022-04-18 08:45:49

我正在处理不同年龄的一些身高和体重的数据集。我的教授希望我绘制回归的soma.WT9残差与回归的残差HT9.WT9（不要介意符号它只是 soma 回归WT9和HT9回归的两列WT9）。

这个阴谋的目的是什么。

2个回答

从细节和变量名称来看，soma.WT9 和 HT9.WT9，您通过首先回归获得残差，WT9 上的 soma 和 WT9 上的 HT9（对吗？）。如果我理解正确，soma.WT9 和 HT9.WT9 之间的散点图会告诉你——如果从 HT9 和 soma 中去除 WT9 的影响（在你的情况下可能是线性影响），HT9 和 soma 之间是否存在关系. 这在 WT9 解释 soma 的所有变异来源的情况下是有益的，那么 soma.WT9 和 HT9.WT9 之间的散点图将不会显示任何特定（可识别/标准）模式。它也可以称为部分残差图。

这听起来像是我所说的“添加变量”图。这些背后的想法是提供一种可视化方式来判断向模型添加变量（在您的情况下为 ht9）是否可能向模型添加任何内容（在您的情况下为 wt9 上的 soma）。

是这样向我解释的。当您拟合线性回归时，变量的顺序很重要。这有点像将 soma 变量中的方差想象成一个“孤岛”。第一个变量“声称”岛上的一部分方差，第二个变量“声称”它可以从剩余的东西中得到什么。

所以基本上这个图会告诉你，soma 的变异（soma.wt9 的残差）中的“还有什么要解释的”可以用“ht9 解释 wt9 之外的任何东西的能力”（ht9.wt9 的残差）来解释。

您还可以用数学方式显示正在发生的事情。soma.wt9 的残差计算为：的wt9 残差为：在上通过原点的回归（因为，所以线将通过原点）给出代入残差方程到这个给出：重新排列项给出：

e_{i} = s o m a - β_{0} - β_{1} w t 9

$e_{i}=soma-\beta_{0}-\beta_{1}wt9$

f_{i} = h t 9 - α_{0} - α_{1} w t 9

$f_{i}=ht9-\alpha_{0}-\alpha_{1}wt9$

e_{i}

$e_i$

f_{i}

$f_i$

\bar{e} = \bar{f} = 0

$\overline{e}=\overline{f}=0$

e_{i} = δ f_{i}

$e_{i}=\delta f_{i}$

s o m a - β_{0} - β_{1} w t 9 = δ (h t 9 - α_{0} - α_{1} w t 9)

$soma-\beta_{0}-\beta_{1}wt9=\delta (ht9-\alpha_{0}-\alpha_{1}wt9)$

s o m a = (β_{0} - δ α_{0}) + (β_{1} - δ α_{1}) w t 9 + δ h t 9

$soma=(\beta_{0}-\delta\alpha_{0})+(\beta_{1}-\delta\alpha_{1})wt9+\delta ht9$

因此，估计斜率（使用 OLS 回归）在的模型中与模型这也清楚地表明了为什么具有相关的回归变量（是重新调整的相关性）会使估计的斜率发生变化，并且可能与预期的结果“相反”。 $soma = \beta_0+\beta_{wt9}wt9 + \beta_{ht9}ht9$ $resid.soma=\beta_{ht9} resid.ht9$ $\alpha_{1}$

我认为这种方法实际上是在计算机能够反转大型矩阵之前进行多元回归的方式。反转大量矩阵可能比反转一个巨大的矩阵更快。 $2\times 2$

其它你可能感兴趣的问题

上一篇如何估计 n=100 时 Spearman 相关性的临界值？下一篇在证明“60% 的人从 A 组切换到 B 组”之类的声明时，使用什么正确的统计测试？