我想知道随机森林是如何在 Weka 中实现的。这篇论文非常具体地介绍了 Weka 中的 RF,但第 2 章中对其学习过程的描述对我来说似乎很奇怪。他们说:
- 引导样本对于每棵树
- 为每个随机选择一个特征子集
- 信息增益用于种植未修剪的树木
我的问题:
- 不应该在决策树的所有级别上重复第 2 步吗?否则每棵树将永远看不到某些特征
- 设置时默认是什么
numFeatures=0。我认为这是每个拆分可用的功能数量。它是所有特征数量的平方根吗? - 信息增益真的用于确定最佳分割属性吗?
我正在使用 Weka 3.8.3 - 不确定这是否重要。
感谢所有提示:)