贝叶斯决策树

数据挖掘 机器学习
2022-03-06 16:48:00

我想了解决策树中的贝叶斯理论以及它如何避免过度拟合,但找不到任何适合刚入门的人的教程。你知道有什么资源可以学习吗?

3个回答

关于决策树的新手和想要起步,我写了一个关于决策树的教程,这将有所帮助。

关于避免过度拟合的方法:任何模型的游戏都是将其复杂性限制在给定数据的合理范围内。决策树的复杂性表现为增加新的决策边界,因此任何复杂性的限制都是它可以绘制的决策边界的限制。两种常见的方法是限制何时可以创建新决策(叶子中的数据最少,信息显着增加等)或更简单地限制树的最大深度。

在决策树中减少过度拟合的一个好方法是剪枝,即不生成树直到最后一个属性(预剪枝),或者生成“完整”树然后进行后剪枝。不确定它是否属于贝叶斯理论本身,但“修剪”树的叶节点具有关于受修剪分支约束的各种分类的概率。Weka(J48 分类器)和随附的书 Data Mining - Practical Machine Learning Tools and Techniques 中有一个实现:

http://www.amazon.com/Data-Mining-Practical-Techniques-Management/dp/0120884070

如果您想更详细地阅读我刚才写的内容,在第 6.1 章中有详细说明

我建议Balaji Lakshminarayanan的网站了解他关于蒙德里安森林的工作,以及Antonio Linero的网站关于此主题的工作。另一个相关主题是贝叶斯多重自适应回归树。下面的论文还总结了一些基于树的模式的贝叶斯方法,- https://www.intechopen.com/books/enhanced-expert-systems/classic-and-bayesian-tree-based-methods