如果您有一组 n 个特征,则您有 2^n-1 个非空特征子集。因此,如果您选择其中之一,您不太可能找到最好的。
对我来说,当你构建模型时,你会想看看它做得不好的地方,并尝试找到有助于改进的功能,或者去掉似乎没有帮助的功能,这似乎很直观。
尽管我已经在实践中看到了这一点并且以这种方式蒙混过关,但我从未见过它背后的任何正式理论。您如何知道要在训练集中添加哪些功能?以及删除哪个?
如果您有一组 n 个特征,则您有 2^n-1 个非空特征子集。因此,如果您选择其中之一,您不太可能找到最好的。
对我来说,当你构建模型时,你会想看看它做得不好的地方,并尝试找到有助于改进的功能,或者去掉似乎没有帮助的功能,这似乎很直观。
尽管我已经在实践中看到了这一点并且以这种方式蒙混过关,但我从未见过它背后的任何正式理论。您如何知道要在训练集中添加哪些功能?以及删除哪个?