scikit-learn 随机森林中的多数投票

数据挖掘 scikit-学习 随机森林
2022-03-08 14:11:50

我主要担心的是我需要了解随机森林如何在 scikit learn 源代码中进行多数投票。我没有在 RandomForest 的源代码中找到该特定代码。如果有人知道,请解释一下。谢谢

2个回答

从文档中引用:

输入样本的预测类别概率计算为森林中树木的平均预测类别概率。一棵树的类概率是叶子中同一类的样本的分数。

然后,预测只是具有最高平均类概率的类。

您可以在此处找到源代码

请注意,这与经典的多数投票不同,后者通常被认为是树中最常见的类别预测,而这里的投票发生在类别概率级别。

回归的源代码在这里

输入样本的预测回归目标被计算为森林中树木的平均预测回归目标。

随机森林是决策树的集合。每个决策树都会对每个观察得出一个“结论”(即预测)。然后将所有树组合在一起。

这是什么意思?

  • 如果您正在训练随机森林回归器,则此组合是每棵树预测的平均值。
  • 如果您正在训练一个随机森林分类器,每棵树的分类都会通过“多数投票”机制组合成最终分类。