我知道随机森林是树木装袋的程式化版本。我们选择随机数据点以及随机特征来构建随机森林。
但是,如果我们通过仅随机选择数据点来使用普通版本的 bagging,那么我们将拥有训练了更多特征的树,这与风格化版本中的随机森林不同。由于学习更多特征,每棵树都有更多关于数据点的信息,因此在某种意义上比随机森林中的单棵树更“智能”。
那么为什么使用程式化版本的 bagging 的随机森林比使用简单的 bagging 实现的随机森林表现更好呢?
我知道使用程式化版本的随机森林给模型提供了较低的方差,但是由于它的每棵树都经过了一些特征的训练,它不应该使模型有点偏高吗?