决策树学习算法用来处理缺失值的方法有哪些。
他们是否只是简单地使用称为缺失的值来填补空缺?
谢谢。
决策树学习算法用来处理缺失值的方法有哪些。
他们是否只是简单地使用称为缺失的值来填补空缺?
谢谢。
各种决策树使用了几种方法。简单地忽略缺失值(如 ID3 和其他旧算法所做的)或将缺失值视为另一个类别(在名义特征的情况下)并不能真正处理缺失值。然而,这些方法被用于决策树开发的早期阶段。
缺失数据的实际处理方法在评估拆分时不使用具有缺失值的数据点。但是,当创建和训练子节点时,这些实例会以某种方式分布。
我知道以下将缺失值实例分配给子节点的方法: