转换系列有什么好处
>>> df
Color
0 Red
1 Blue
2 Green
3 Red
像下面这样的多个系列?
>>> pd.get_dummies(df)
Color_Blue Color_Green Color_Red
0 0 0 1
1 1 0 0
2 0 1 0
3 0 0 1
也可以为颜色列设置一个热编码值,如下所示?
>>> labels=list(set(df.Color))
>>> pd.DataFrame(df.Color.map({x:labels.index(x) for x in labels}).rename('Color_Code'))
Color_Code
0 1
1 2
2 0
3 1
我知道在语法上pd.get_dummies看起来要简单得多,但不知何故,我想倾向于使用更少的功能而不是更多的功能......