据我了解,ExtraTreesRegressor
通过sklearn
进行随机拆分而不是最小化诸如用于分类的 gini 或用于回归的 mae 之类的指标。
我不明白为什么会有一个criterion
参数,因为分割的标准应该是随机的。
只是为了代码兼容性,还是我遗漏了什么?
据我了解,ExtraTreesRegressor
通过sklearn
进行随机拆分而不是最小化诸如用于分类的 gini 或用于回归的 mae 之类的指标。
我不明白为什么会有一个criterion
参数,因为分割的标准应该是随机的。
只是为了代码兼容性,还是我遗漏了什么?
不,极其随机的树仍然可以优化分割。它只为每个特征(从那些随机选择的max_features
特征中)选择一个随机分裂点,但是实际用于分裂的特征取决于选择的标准。
https://scikit-learn.org/stable/modules/ensemble.html#extremely-randomized-trees
标准参数用于衡量选择时分割的质量,它不参与初始分割算法(用于分割的特征是随机选择的)
ExtraTreesRegressor:
参考:
https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.ExtraTreesRegressor.html
标准{“mse”, “mae”}, default=”mse” 衡量分割质量的函数。支持的标准是均方误差的“mse”,它等于作为特征选择标准的方差减少,以及平均绝对误差的“mae”。