QUEST 与其他决策树算法相比如何?

数据挖掘 数据挖掘 预测建模 决策树
2022-02-24 20:39:03

SPSS Modeler 具有 QUEST 以及 C&RT、C5.0 和 CHAID 的实现。QUEST 在教科书中相对很少涉及 - 与其他决策树算法相比,它的优缺点是什么?它是如何产生分裂的?为什么它(显然)不像 C&RT 或 C5.0 那样广泛使用?

1个回答

QUEST 代表快速、无偏且高效的统计树。

它使用 ANOVA F 和列联表卡方检验来选择用于拆分的变量。具有多个类的变量被合并到两个超类中以获得使用 QDA(二次判别分析)确定的二元拆分。可以使用 CART 算法修剪树。它可以用于分类和回归任务。

Quest 首先通过将判别坐标分配给预测变量的类别,将分类(符号)变量转换为连续变量。然后它应用二次判别分析(QDA)来确定分裂点。请注意,QDA 通常会产生两个分界点——选择一个更接近第一个超类的样本均值的分界点。

QUEST 树算法的一个优点是它不会偏向于分裂变量的选择,这与 CART 不同,CART 倾向于选择允许更多分裂的分裂变量,以及那些具有更多缺失值的分裂变量。

不知道为什么它没有像 CART 或 C5.0 那样广泛使用。这可能是由于文献中 CART/C5.0 的覆盖面比其他文献更大。

参考:

  1. Quest 参考手册: http: //www.stat.wisc.edu/~loh/treeprogs/guide/guideman.pdf
  2. http://www.stat.wisc.edu/~loh/quest.html