前向或后向逐步回归

数据挖掘 回归
2022-01-31 22:41:24

我理解为什么要执行逐步回归的过程和逻辑。对我来说,它们应该始终达到相同的功能,只有一个添加系数并测试显着性,而另一个在测试显着性时删除系数。使用其中一种与另一种之间是否有任何重大的权衡?

1个回答

想象一下,您有 20 个系数要测试,并且还具有您想要击败的目标准确度(或您感兴趣的任何指标)。它充当阈值。

一种权衡可能是执行“向后回归”意味着理论上您将从最大准确度开始,并且每次删除参数时都会降低。仅删除 3 个参数后,您可能会降低阈值!所以不一定需要继续。

相反,从单个参数开始并逐步提高,您将不得不尝试 17 个模型 5o 达到您的阈值。

这种情况当然可以逆转,因此了解您的数据并就最适合您的情况做出明智的决定非常重要。