我打算用线性 SVM 做一个简单的分类。我拥有的一个功能是以前完成的另一种分类。我可以将此类功能用作 1-hot 编码数组吗?所以,例如对于 3 个不同的类,我有 3 个二进制特征是 0 还是 1?
我看到的问题是这个特性不是线性的,而是二进制的。这会造成问题吗?如果是的话,我怎样才能以某种方式将二进制特征转换为线性特征?
我打算用线性 SVM 做一个简单的分类。我拥有的一个功能是以前完成的另一种分类。我可以将此类功能用作 1-hot 编码数组吗?所以,例如对于 3 个不同的类,我有 3 个二进制特征是 0 还是 1?
我看到的问题是这个特性不是线性的,而是二进制的。这会造成问题吗?如果是的话,我怎样才能以某种方式将二进制特征转换为线性特征?
快速回答是肯定的,您可以在存在编码分类变量的情况下使用线性 SVM。
简短解释:模型的线性与模型的特征无关,实际上线性特征并不意味着什么。线性度指的是模型,即将目标与特征联系起来的方程。
方程
表示 y 关于 x 是线性的,而不是变量 x 是线性的。x 就是 x 就是这样。
处理线性模型时应该检查的是您的数据是否是线性可分的,或者换句话说,您是否可以用直线分隔不同的类。如果不是这种情况,你就有麻烦了,可能应该考虑改变模型。