考虑到随机森林中的单个树使用购物车算法(或可以配置为),如果购物车无法预测任何东西(空树),为什么随机森林在同一数据集上表现更好。
编辑:我正在使用 R (rpart vs randomForest) ;该数据是股票的每日财务数据。CART 给出了空树,但随机森林即使在看不见的数据上也能达到不错的准确性。
考虑到随机森林中的单个树使用购物车算法(或可以配置为),如果购物车无法预测任何东西(空树),为什么随机森林在同一数据集上表现更好。
编辑:我正在使用 R (rpart vs randomForest) ;该数据是股票的每日财务数据。CART 给出了空树,但随机森林即使在看不见的数据上也能达到不错的准确性。
拥有树木的“森林”(bagging ensemble)的目标是使预测更加可靠。个体决策树往往会过拟合,而随机森林的抽样、特征选择和装袋有助于获得更稳健的分数。
你有一棵空树很奇怪,因为决策树是贪婪的,它们适合任何东西。即使您的数据中只有随机噪声,它们也会进行拆分(取决于您如何配置它)。
如果你有一棵空树,随机森林不会做任何事情,因为它只是一堆决策树。
如果没有看到您的代码,或者没有其他任何东西,我猜您在某处有编码错误。