在非线性多项式回归的情况下如何确定自变量的幂?

数据挖掘 机器学习 预测建模 统计数据 算法 回归
2022-03-07 14:31:16

考虑一个因变量“Y”和 10 个自变量或特征 - X1、X2、X3、... X10。

我想创建一个非线性多项式回归模型,这样 -

Y ~ a1.X1^b1 + a2.X2^b2 + .... + a10.X10^b10

我想知道是否有任何算法可以确定自变量的幂的最佳可能值,即数据中的 b1、b2、... b10 的值。

1个回答

如果您只关心预测的质量(而不是解释能力),请完全跳过线性模型并改用梯度提升树。梯度提升一般可以轻松学习多项式样条,而且您不必自己手动制作一堆多项式预测器。

顺便说一句,梯度提升是在 Python 的 scikit-learn 库、R 的 caret 库和 Java/Scala 的 Weka 库中实现的。