在我的机器学习课上,我们了解了 LASSO 回归如何非常擅长执行特征选择,因为它利用了正则化。
我的问题:人们通常使用 LASSO 模型只是为了进行特征选择(然后继续将这些特征转储到不同的机器学习模型中),还是他们通常使用 LASSO 来执行特征选择和实际回归?
例如,假设你想做岭回归,但你认为你的很多特征都不是很好。运行 LASSO 是否明智,仅采用算法未接近零的特征,然后仅使用那些将数据转储到岭回归模型中的特征?通过这种方式,您可以获得正则化以执行特征选择的好处,还正则化以减少过度拟合的好处。(我知道这基本上相当于弹性网络回归,但似乎您不需要在最终回归目标函数中和
除了回归之外,在执行分类任务(使用 SVM、神经网络、随机森林等)时,这是一个明智的策略吗?