ExtraTreesRegressor 标准

数据挖掘 Python scikit-学习 随机森林
2021-09-16 11:34:37

据我了解,ExtraTreesRegressor通过sklearn进行随机拆分而不是最小化诸如用于分类的 gini 或用于回归的 mae 之类的指标。

我不明白为什么会有一个criterion参数,因为分割的标准应该是随机的。

只是为了代码兼容性,还是我遗漏了什么?

2个回答

不,极其随机的树仍然可以优化分割。它只为每个特征(从那些随机选择的max_features特征中)选择一个随机分裂点,但是实际用于分裂的特征取决于选择的标准。

https://scikit-learn.org/stable/modules/ensemble.html#extremely-randomized-trees

标准参数用于衡量选择时分割的质量,它不参与初始分割算法(用于分割的特征是随机选择的)

ExtraTreesRegressor:

  • mse 和 mae 是唯一可用的选项,mse 是默认选项。mae 是在 0.18 版本之后添加的。检查您的版本是否可用。使用 mae 报告了一些问题。

参考:

https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.ExtraTreesRegressor.html

标准{“mse”, “mae”}, default=”mse” 衡量分割质量的函数。支持的标准是均方误差的“mse”,它等于作为特征选择标准的方差减少,以及平均绝对误差的“mae”。