对于随机森林,我们通过基尼杂质或熵来分割节点以获得一组特征。sklearn 中的 RandomForestClassifier,我们可以选择使用 Gini 或 Entropy 准则进行分割。但是,我读到的关于 Extra-Trees Classifier 的内容,为拆分选择了一个随机值(我想这与 Gini 或 Entropy 无关)。sklearn 的 ExtraTreesClassifier 可以选择 Gini 或 Entropy 进行拆分。我在这里有点困惑。
随机森林和极端随机树的分裂方式有何不同?
机器算法验证
分类
Python
随机森林
scikit-学习
2022-03-20 11:43:50
1个回答
随机森林的一次迭代:
- 选择特征随机作为候选分割特征集
- 在这些特征中的每一个中,找到“最佳”切点,其中“最佳”由基尼/熵/任何度量定义
- 现在你有特征与其最佳切点配对。选择作为您的分割特征并切点在基尼/熵/任何度量方面具有“最佳”性能的对
极端随机树的一次迭代:
选择特征随机作为候选分割特征集
在这些功能中的每一个中, 和从区间中均匀地绘制一个随机切点. 使用此切点相对于 Gini / Entropy / 任何度量来评估此功能的性能
- 现在你有特征与其随机选择的切点配对。选择作为您的分割特征并切点在基尼/熵/任何度量方面具有“最佳”性能的对