通过将 2 个功能结合在一起来“帮助”决策树

数据挖掘 机器学习 特征选择 决策树 特征工程 损失函数
2022-02-06 14:10:03

假设我的数据集中有 2 个(或更多)特征肯定是相关联的(例如:特征 B 表示特征 A 的相关程度),我有没有办法设计一个决策树,将两个特征联系在一起(明显的分裂是如果特征 B 被 A 分割得足够大,如果不忽略 A)?
换句话说:我正在寻找一种方法来“帮助”我的决策树在测试功能 B 之前不测试功能 A。另外,不要单独查看每个功能的改进,而是关注“B 和后记”的改进一种”。任何帮助将不胜感激!

1个回答

一种方法是通过函数组合 A 和 B 并从数据集中消除 A 和 B 来创建新特征。相关的特征越少越好。那么你就没有多余的功能了。

但实际上,使用随机森林可能就足够了。然后模型将有足够的树来确定最好的分割是首先是 B,然后是 A。