我正在尝试从一组数字和分类特征中训练 SVM,例如:
- 距离 X(数字)
- 距离 Y(数字)
- 字体大小差异(数字)
- 字 1 粗体(布尔)
- 字 2 粗体(布尔)
- Word 1 字体大小(数字)
- ...
为了将特征映射到特征数组,我将 true 视为 1,将 false 视为 0,然后使用 Z 分数对整个特征数组进行归一化。
我是否应该将 false 编码为 -1,以便它对支持向量的生成产生数值影响,值为 0 它不会修改所选向量(我假设)?
布尔特征应该以与数字相同的方式归一化,还是应该保留其编码值?