最近遇到了一个关于“如何赢得 Kaggle 比赛”的课程,其中解释了我们如何从决策树的每个叶节点设计一个分类特征。
[视频链接][1]
我无法理解这个概念。任何有助于理解这一点的建议或指示都会很棒。
例如假设以下随机训练数据:
Gender Age Sample_Ftre
M 25 1.5
M 26 1.5
F 28 1.5
F 27 1.5
M 26 1.5
任何人都可以解释engineered_feature决策树中 new 的值是什么以及如何计算它。