get_dummies和labelbinarizer在他们想要实现的目标方面有什么区别吗?似乎两者都会以某种方式进行一次性编码。
get_dummies 和 labelbinarizer 的区别?
数据挖掘
特征工程
编码
2022-03-07 09:12:32
1个回答
我想到了几件事。
get_dummies 可以转换具有多列的数据帧,而 LabelBinarizer 只会做一列。
get_dummies 输出具有格式良好的列的数据帧(如果输入是数据帧),而 LabelBinarizer 输出一个 numpy 数组,因此如果要将标签附加到它们,则需要从 LabelBinarizer 的拟合实例中获取它们。
使用 LabelBinarizer 进行逆变换更直观,它有一个名为 inverse_transform 的方法,而使用 get_dummies 您需要执行类似 dummies.idxmax(axis=1) 的操作
所以总的来说,get_dummies 似乎是一个更好的选择