get_dummies 和 labelbinarizer 的区别?

数据挖掘 特征工程 编码
2022-03-07 09:12:32

get_dummieslabelbinarizer在他们想要实现的目标方面有什么区别吗?似乎两者都会以某种方式进行一次性编码。

1个回答

我想到了几件事。

get_dummies 可以转换具有多列的数据帧,而 LabelBinarizer 只会做一列。

get_dummies 输出具有格式良好的列的数据帧(如果输入是数据帧),而 LabelBinarizer 输出一个 numpy 数组,因此如果要将标签附加到它们,则需要从 LabelBinarizer 的拟合实例中获取它们。

使用 LabelBinarizer 进行逆变换更直观,它有一个名为 inverse_transform 的方法,而使用 get_dummies 您需要执行类似 dummies.idxmax(axis=1) 的操作

所以总的来说,get_dummies 似乎是一个更好的选择