我对在 weka 中为我的应用程序使用哪种决策树算法感到困惑。我有 5 个实际输入变量和 2 个类。在各种在线教程中,J48 (C 4.5) 似乎是首选算法。是否有任何经验法则/提示/技巧来决定应该使用哪种树算法?

我对在 weka 中为我的应用程序使用哪种决策树算法感到困惑。我有 5 个实际输入变量和 2 个类。在各种在线教程中,J48 (C 4.5) 似乎是首选算法。是否有任何经验法则/提示/技巧来决定应该使用哪种树算法?

从 J4.8 开始,因为它是训练最快的并且通常会产生良好的结果。它的输出也是人类可读的,因此你可以看看它是否有意义。它有树可视化工具来帮助理解。它是最常用的数据挖掘算法之一。
如果 J4.8 没有给你足够好的解决方案,请尝试其他算法。
随机森林可能会为您提供更好的解决方案,但它不是人类可读的,并且不如 J4.8 快(由于正在训练多棵树)。
如果您想了解树算法如何更好地工作,我建议您遵循以下策略。
还有一些问题需要考虑选择算法。