什么样的学习问题适合支持向量机?

数据挖掘 机器学习 支持向量机 监督学习 无监督学习
2021-10-03 23:24:30

哪些特征或属性表明可以使用支持向量机解决某个学习问题?

换句话说,当你看到一个学习问题时,是什么让你“哦,我绝对应该为此使用 SVM”而不是神经网络或决策树或其他任何东西?

2个回答

SVM 可用于分类(区分多个组或类别)和回归(获得数学模型来预测某事)。它们可以应用于线性和非线性问题。

直到 2006 年,它们都是机器学习的最佳通用算法。我试图找到一篇比较最知名算法的许多实现的论文:支持向量机、神经网络、树等。我找不到它很抱歉(你必须相信我,坏事)。在论文中,获得最佳性能的算法是 svm,带有库 libsvm。

2006 年,Hinton 提出了深度学习和神经网络。他将当前的技术水平提高了至少 30%,这是一个巨大的进步。然而,深度学习只能在巨大的训练集上获得良好的性能。如果你有一个小的训练集,我建议使用 svm。

此外,您可以在此处找到有关何时使用scikit-learn 的不同机器学习算法的有用信息图。但是,据我所知,科学界对于问题是否具有 X、Y 和 Z 特征没有达成一致意见,那么最好使用 svm。我建议尝试不同的方法。另外,请不要忘记 svm 或神经网络只是一种计算模型的方法。您使用的功能也非常重要。

假设我们处于分类设置中。

因为svm特征工程是基石:

  • 集合必须是线性可分的。否则需要转换数据(例如使用内核)。这不是由算法本身完成的,并且可能会破坏功能的数量。
  • 我想说的是,svm当我们比其他方法(树集成)更快地增加维度数量时,性能会受到影响。这是由于支持svms 的约束优化问题。有时减少特征是可行的,有时则不是,这就是我们无法真正为有效使用svm
  • svm可能会在特征数量远大于观察数量的数据集上遇到困难。同样,这可以通过查看约束优化问题来理解。
  • svm分类变量不是由算法开箱即用地处理的。