我正在使用随机森林模型。我的一个自变量几乎可以肯定对因变量有抛物线效应。在线性回归中,我会将变量包括为线性和平方,以捕捉这种效果。我应该在随机森林中做同样的事情吗?
通过扩展,对于具有逻辑效应的变量(例如年龄),同样的问题?
我正在使用随机森林模型。我的一个自变量几乎可以肯定对因变量有抛物线效应。在线性回归中,我会将变量包括为线性和平方,以捕捉这种效果。我应该在随机森林中做同样的事情吗?
通过扩展,对于具有逻辑效应的变量(例如年龄),同样的问题?
随机森林使用使用 CART 算法的决策树集合。
由于 CART(分类和回归树)是一种非参数算法,它们应该能够找到变量和非线性行为之间的交互作用。
尽管如此,构建多项式可以帮助它们获得更好的性能。