简单线性模型和黄土模型有什么区别?

机器算法验证 回归 黄土
2022-03-23 13:37:39

有人可以向我解释统计中线性模型和黄土模型之间的区别吗?我需要向非数学人士解释这一点。

3个回答

一个非常非技术性的答案

一个简单的线性模型通过一组点拟合一条直线。这条线是最好的直线(至少,对于最佳的一个合理定义)

黄土模型通过一组点拟合复杂的曲线。在某些方面,它可以被认为是一个复杂的移动平均线。这是可能的最佳曲线(至少,对于最佳的一个合理定义)

loess.demoR 的 TeachingDemos 包中的函数将交互式地展示黄土拟合背后的想法。它将绘制一组数据和黄土拟合,然后当您单击一个点时,它将显示用于拟合该点的窗口、窗口内各点的相对权重以及“线性模型”适合该点加权数据。然后单击其他点将更新显示以显示黄土拟合的一般概念。

这可能有助于解释黄土的作用,并可能有助于解释差异。

这是一个简单但详细的回应。

线性模型通过所有数据点拟合关系。该模型可以是一阶(“线性”的另一种含义)或多项式来解释曲率,或者使用样条来解释具有不同控制模型的不同区域。

LOESS 拟合是基于原始数据点的局部移动加权回归。那是什么意思?

LOESS 拟合输入原始 X 和 Y 值,加上一组输出 X 值,用于计算新的 Y 值(通常两者使用相同的 X 值,但通常较少的 X 值用于拟合的 XY 对,因为需要增加计算量)。

对于每个输出 X 值,输入数据的一部分用于计算拟合。数据的一部分,通常为 25% 到 100%,但通常为 33% 或 50%,是本地的,这意味着它是最接近每个特定输出 X 值的原始数据部分。这是一个移动拟合,因为每个输出 X 值都需要原始数据的不同子集,具有不同的权重(参见下一段)。

这个输入数据点的子集用于执行加权回归,最接近输出 X 值的点被赋予更大的权重。这种回归通常是一阶的;二阶或更高阶是可能的,但需要更大的计算能力。在输出 X 处计算的该加权回归的 Y 值用作该 X 值的模型 Y 值。

在每个输出 X 值处重新计算回归以生成完整的输出 Y 值集。