如何将类特征包含到线性 SVM

数据挖掘 分类 支持向量机 特征工程 二进制
2022-02-22 00:22:33

我打算用线性 SVM 做一个简单的分类。我拥有的一个功能是以前完成的另一种分类。我可以将此类功能用作 1-hot 编码数组吗?所以,例如对于 3 个不同的类,我有 3 个二进制特征是 0 还是 1?

我看到的问题是这个特性不是线性的,而是二进制的。这会造成问题吗?如果是的话,我怎样才能以某种方式将二进制特征转换为线性特征?

1个回答

快速回答是肯定的,您可以在存在编码分类变量的情况下使用线性 SVM。

简短解释:模型的线性与模型的特征无关,实际上线性特征并不意味着什么。线性度指的是模型,即将目标与特征联系起来的方程。

方程

y=bx+q

表示 y 关于 x 是线性的,而不是变量 x 是线性的。x 就是 x 就是这样。

处理线性模型时应该检查的是您的数据是否是线性可分的,或者换句话说,您是否可以用直线分隔不同的类。如果不是这种情况,你就有麻烦了,可能应该考虑改变模型。