在课程中,我刚刚学习了多元线性回归和多项式回归。
当多项式回归总是能更好地拟合数据时,为什么还要使用多元线性回归?
在课程中,我刚刚学习了多元线性回归和多项式回归。
当多项式回归总是能更好地拟合数据时,为什么还要使用多元线性回归?
首先请注意,多项式回归是多元线性回归的特例。
让我们考虑三个模型:
型号1
和
模型2
和
模型3
当然,Model3会解释数据中的最大偏差。但是,如果您有过度拟合,您可能会选择 Model1 或 Model2。此外,如果五个中的一些不重要,您可以将它们排除在外。如果没有非线性,则选择Model1。如果只有一个解释变量显示出显着影响,但该变量与您为Model2使用的解释变量具有非线性关系。
您可以使用变量选择来检查变量是否与模型相关。一种著名的变量选择算法是 Boruta,但您也可以使用 AIC 和 BIC 进行变量选择。