使用oob作为指标的Scikitlearn网格搜索随机森林?

数据挖掘 Python scikit-学习 随机森林 公制 网格搜索
2022-02-14 06:11:04

已查看 oob 上的数据,但希望将其用作随机森林分类器(多类)上的网格搜索中的指标,但似乎不是评分参数的公认记分器。我确实True在分​​类器中设置了 OoB。
目前正在使用scoring ='accuracy'但想更改为 oob 分数。
欢迎提出意见或意见

3个回答

查看 sklearn 中的 make_scorer 函数:http ://scikit-learn.org/stable/modules/generated/sklearn.metrics.make_scorer.html

您可能需要自己编写 OoB 组件,我之前从未在 Sklearn 中使用该指标进行评分,所以我不确定。

另外,考虑使用随机搜索而不是网格搜索,在处理大的超参数空间时更实用,因为它不需要搜索没有影响的参数的整个维度。

抱歉 - 我知道这是在旧线程上,但您可以model.oob_score_在运行模型拟合后尝试调用。它应该提供 OOB 准确性

我希望我的措辞正确。

您可以将其称为最佳估计器的属性,即

grid_model.best_estimator_.oob_score_

所以你不能真正使用grid_model.oob_score_,因为 gridsearchcv 没有这样的属性;但是您可以调用随机森林模型的最佳实例,然后调用属性。