对于分类变量,如果变量是非二进制的,则必须使用一种热编码。但是序数呢?这些变量是有序但互斥的。除了标签之外,它们是否需要与分类对象相同的处理?
序数变量是否需要一种热编码?
机器算法验证
序数数据
分类编码
贴标签
2022-04-11 09:33:59
1个回答
回归中序数独立数据的正确处理是棘手的。
最常见的两种方法是:
将其视为连续的(但这忽略了水平差异可能不相似的事实)。
将其视为分类(但这忽略了变量的有序性质)。
第一种方法不需要一次性编码。第二个会。
已经开发了一些新方法。我有时发现有用的一个是最佳缩放。