什么时候使用多元线性回归而不是多项式回归更好?

机器算法验证 回归 多重回归 模型选择 多项式 偏差-方差-权衡
2022-04-09 06:13:27

在课程中,我刚刚学习了多元线性回归和多项式回归。

当多项式回归总是能更好地拟合数据时,为什么还要使用多元线性回归?

1个回答

首先请注意,多项式回归是多元线性回归的特例。


让我们考虑三个模型:

型号1

Y=β1x1+β2x2+β3x3+ϵ

模型2

Y=β1x1+β2x12+β3x13+ϵ

模型3

Y=β1x1+β2x12+β3x13+β4x2+β5x3+ϵ


当然,Model3会解释数据中的最大偏差。但是,如果您有过度拟合,您可能会选择 Model1 或 Model2。此外,如果五个中的一些不重要,您可以将它们排除在外。如果没有非线性,则选择Model1如果只有一个解释变量显示出显着影响,但该变量与您为Model2使用的解释变量具有非线性关系β


您可以使用变量选择来检查变量是否与模型相关。一种著名的变量选择算法是 Boruta,但您也可以使用 AIC 和 BIC 进行变量选择。