决策树空间与随机森林的 MCMC 采样

机器算法验证 马尔可夫链蒙特卡罗 蒙特卡洛 随机森林 大车
2022-02-27 20:34:10

随机森林是通过仅随机选择某些特征来构建每棵树(有时对训练数据进行装袋)而形成的决策树的集合。显然,他们学习和概括都很好。有没有人对决策树空间进行 MCMC 采样或将它们与随机森林进行比较?我知道运行 MCMC 并保存所有采样树的计算成本可能更高,但我对这个模型的理论特征感兴趣,而不是计算成本。我的意思是这样的:

  1. 构建一个随机决策树(它可能会执行得很糟糕)
  2. 类的东西计算树的可能性,或者添加一个项。P(Tree|Data)P(Data|Tree)Pprior(Tree)
  3. 选择一个随机步骤来更改树并根据可能性进行选择。P(Tree|Data)
  4. 每 N 步,保存一份当前树的副本
  5. 回到 3 进行一些大的 N*M 次
  6. 使用 M 个保存的树的集合进行预测

这会给随机森林带来类似的性能吗?请注意,与随机森林不同,我们不会在任何步骤丢弃好的数据或特征。

2个回答

这是大约 13 年前由Chapman、George 和 McCulloch (1998, JASA)完成的。当然,有大量关于贝叶斯回归树的文献就是从这个想法发展而来的。

不幸的是,奇普曼等人。在他们的贝叶斯 CART 方法中,只提取最可能的树。他们从未尝试对树进行平均,并将性能与随机森林和额外树进行比较。

我刚刚阅读了 Chipman 的 BART 论文。如果我理解正确,它是对 m 树集合的 K 个样本的贝叶斯平均。它在很多方面都很有趣,而且确实表现得非常好。当 m='1' 时,它是来自后验的 1 棵树的 K 个样本的简单贝叶斯平均。但是,在该特定方面没有进行太多测试。而且我仍然想知道随机森林或额外树与真正的贝叶斯模型相比如何。