我一直在阅读一些关于如何处理决策树的名义特征(sklearn 实现)的stackoverflow问题。
答案之一指出:
使用 OneHotEncoder 是当前唯一有效的方法,允许任意拆分不依赖于标签排序,但计算量很大。
但是如果我们使用LabelEncoder并使我们的树足够深,它最终会隔离每个类别并且输出保持不变。
那么 OneHotEncoding 的优势是什么?
我一直在阅读一些关于如何处理决策树的名义特征(sklearn 实现)的stackoverflow问题。
答案之一指出:
使用 OneHotEncoder 是当前唯一有效的方法,允许任意拆分不依赖于标签排序,但计算量很大。
但是如果我们使用LabelEncoder并使我们的树足够深,它最终会隔离每个类别并且输出保持不变。
那么 OneHotEncoding 的优势是什么?