在一些作业和黑客马拉松中,我使用随机森林和 XGBoost 等算法创建了几个模型,并使用 GridSearchCV 来找到最佳的参数组合。但我无法理解的是如何为 GridSearchCV 选择这些参数。我随机放的参数如
params = {"max_depth" : [5, 7, 10, 15, 20, 25, 30, 40, 50,100],
"min_samples_leaf" : [5, 10, 15, 20, 40, 50, 100, 200, 500, 1000,10000],
"criterion": ["gini","entropy"],
"n_estimators" : [10, 15, 20, 40, 50, 75, 100,1000],
"max_features" : ["auto", "sqrt","log2"]}
但是我如何决定是否可以选择更好的参数,这些参数可能在计算上也更好?我不能每次都对随机森林分类器使用相同的上述参数吗?