标准决策树算法,如 ID3 和 C4.5,有一种蛮力方法来选择连续特征中的切点。每个值都作为可能的切点进行测试。(通过测试我的意思是,例如信息增益是在每个可能的值上计算的。)
由于有许多连续特征和大量数据(因此每个特征有很多值),这种方法似乎非常低效!
我假设找到一种更好的方法来做到这一点是机器学习中的一个热门话题。事实上,我的谷歌学术搜索揭示了一些替代方法。比如用k-means进行离散化。然后似乎有很多论文解决特定领域的特定问题。
但是,是否有最近的评论论文、博客文章或书籍对常见的离散化方法进行了概述?我一个都没找到...
或者,也许你们中的一个人是该主题的专家并且愿意写一个小概述。那将非常有帮助!