对于具有两个级别的名义分类变量,例如性别(级别 = 男性,女性),使用标签编码而不是 One Hot 编码是否可行?如果是这样,对于这样的分类变量,使用一种编码方法而不是另一种编码方法是否有任何影响?
具有两个级别的名义分类变量:标签编码还是一个热编码?
数据挖掘
分类数据
2022-03-10 04:02:24
1个回答
如果您在这里使用 one-hot,您只是添加了一个不必要的变量,该变量与模型中的另一个变量完全相关。与其将其视为“0=male, 1=female”的性别标签编码,不如将其视为 is_female 的二进制标志,其中“0=false, 1=true”。
其它你可能感兴趣的问题