为什么 RandomForestClassifier 没有 cost_complexity_pruning_path 方法?

数据挖掘 Python scikit-学习
2022-03-05 10:46:39

为了防止我的随机森林模型过度拟合训练数据集,我查看了ccp_alpha参数。我确实注意到可以使用超参数搜索方法(as GridSearchCV)对其进行调整。

我发现有一个Scikit-Learn 教程可以调整决策树模型的这个ccp_alpha参数。所描述的方法使用决策树模型的方法。本节很好地解释了该方法的工作原理。我知道它试图找到生成模型的子树,以减少过度拟合,同时使用由该方法确定的值。cost_complexity_pruning_pathccp_alphacost_complexity_pruning_path

clf = DecisionTreeClassifier()
path = clf.cost_complexity_pruning_path(X_train, y_train)
ccp_alphas, impurities = path.ccp_alphas, path.impurities

但是,我想知道为什么 Scikit-Learn 中的随机森林模型类型没有实现这些ccp_alpha选择和修剪概念。是否可以通过一些修补来做到这一点?对我来说,这似乎比通过搜索超参数(无论你使用什么......)来找到一个好的价值更合乎逻辑

0个回答
没有发现任何回复~