是否可以在没有决策树的情况下构建集成模型?

数据挖掘 机器学习 随机森林 决策树 集成建模 合奏
2021-09-27 17:35:21

是否可以在没有决策树的情况下构建集成模型?

我知道对合奏本身的描述并非如此。但是,我对机器学习真的很陌生,到目前为止我遇到的所有集成模型都使用或使用决策树进行描述。

3个回答

到目前为止,我使用/描述的所有集成模型都使用决策树。

随机森林是决策树的“集成版本”。这是一种常用的集成方法,因为它内置在算法本身中。然而,集成方法比决策树更通用,可以与任何学习方法一起使用,例如通过堆叠模型

在最高抽象层次上,答案是肯定的。

您可以将一组要评分的值发送到集成中的每个模型,然后根据预定公式将一组分数的结果组合成一个分数。

从形式上讲,每笔交易在系统中都遵循相同的路径,因此不涉及决策。

您确实可以使用其他弱学习器(因为通常称为集成的组件)而不仅仅是决策树。也就是说,决策树集成使用最广泛,尤其是梯度提升树和随机森林。

有时,其他集成只是促进算法分析的概念工具,例如当您试图从集成的角度理解神经网络中的 dropout 时(参见本文)。有时,它们被用来提高模型的性能,尤其是在比赛环境中。当您查看在 Kaggle 比赛中表现良好的解决方案时,您经常会看到复杂的集合。

集成不必由来自同一模型类的弱学习器组成。例如,最近的一篇论文发现了集成梯度提升树模型(当然,它们本身就是集成)与某些神经网络的良好性能的证据。

如果您正在寻找一种简单的方法来使用非决策树集成,您可能想看看XGBoost它不仅是基于决策树的集成的两个最重要的实现之一(另一个是LightGBM),而且它还实现了线性函数的提升集成