我正在尝试构建一个包含 70 个属性的回归树,业务团队希望在其中修复前两个级别,即国家和产品类型。为此,我有两个建议:
为国家和产品类型的每个组合构建一个单独的树,并相应地使用数据子集并传递到相应的树进行预测。在评论中看到这里。我在国家/地区有 88 个级别,在产品类型中有 3 个级别,因此它将生成 264 棵树。
构建具有两个变量的基本树,即国家和产品类型,具有适当的 cp 值,以生成所有组合作为叶节点 (264)。构建具有其余所有变量的第二棵树,并将树一棵树堆叠在二棵树上作为单个决策树。
我不认为第一个是正确的方法。此外,我被困在如何在第二种方法中堆叠树木,即使它不是正确的方法也很想知道如何实现这一点。
请指导我如何解决这个问题。