哪些机器学习算法更适合二分类?

数据挖掘 分类 二元分类
2022-03-01 05:40:59

我们知道有许多不同类型的分类算法。但是在不同类别的分类算法中,哪些算法适合二分类,哪些适合更多类,为什么?

2个回答

如果您想要高度字面化,逻辑回归非常适合二元类,但完全不适合的类。不用担心:有多项逻辑回归,其理论模仿二元逻辑回归(人们可能认为逻辑回归是多项逻辑回归的特例)。根据我的听众的复杂程度,我可能会很乐意提到“逻辑回归”,并让他们意识到当有类别时,我的意思是“二元”逻辑回归.3+3+2

随机森林可以处理二元情况,也可以处理多类情况。同样适用于 k 近邻、支持向量机和神经网络。

我想不出一个缺少多类模拟的二元类模型。

答案是没有一个答案。机器学习算法的选择——无论是二分类还是多分类——很大程度上取决于您的数据和应用程序:

  • 你的训练集有多大?
  • 训练集的平衡程度如何?
  • 它包含多少个因变量?
  • 你的两个类在这些变量上的可分离性是什么?
  • 您需要什么样的准确度/召回率?
  • 结果是决定生死,还是帮助你决定下午点心吃什么?
  • 您是这样做一次,还是要开发多个模型?

例如,如果你有一个简单的线性可分问题,训练集很小,那么线性判别解 (Fisher) 最有意义,但如果你有一个复杂的可分边界,训练集很小,那么 LR、SVM 或决策树可能会更好,或者如果您有大量数据,您可以使用神经网络。您还应该考虑要在模型上投入多少时间。一般来说,神经网络是一个相当大的时间投资,但更简单的模型,如 LR 和 KNN 可以在 Excel 中实现。

也就是说,有关数据和应用程序的更多信息可能使我们能够提供更好的建议。