序数变量是否需要一种热编码?

机器算法验证 序数数据 分类编码 贴标签
2022-04-11 09:33:59

对于分类变量,如果变量是非二进制的,则必须使用一种热编码。但是序数呢?这些变量是有序但互斥的。除了标签之外,它们是否需要与分类对象相同的处理?

1个回答

回归中序数独立数据的正确处理是棘手的。

最常见的两种方法是:

  1. 将其视为连续的(但这忽略了水平差异可能不相似的事实)。

  2. 将其视为分类(但这忽略了变量的有序性质)。

第一种方法不需要一次性编码。第二个会。

已经开发了一些新方法。我有时发现有用的一个是最佳缩放。