我们知道有许多不同类型的分类算法。但是在不同类别的分类算法中,哪些算法适合二分类,哪些适合更多类,为什么?
哪些机器学习算法更适合二分类?
数据挖掘
分类
二元分类
2022-03-01 05:40:59
2个回答
如果您想要高度字面化,逻辑回归非常适合二元类,但完全不适合的类。不用担心:有多项逻辑回归,其理论模仿二元逻辑回归(人们可能认为逻辑回归是多项逻辑回归的特例)。根据我的听众的复杂程度,我可能会很乐意提到“逻辑回归”,并让他们意识到当有类别时,我的意思是“二元”逻辑回归.
随机森林可以处理二元情况,也可以处理多类情况。同样适用于 k 近邻、支持向量机和神经网络。
我想不出一个缺少多类模拟的二元类模型。
答案是没有一个答案。机器学习算法的选择——无论是二分类还是多分类——很大程度上取决于您的数据和应用程序:
- 你的训练集有多大?
- 训练集的平衡程度如何?
- 它包含多少个因变量?
- 你的两个类在这些变量上的可分离性是什么?
- 您需要什么样的准确度/召回率?
- 结果是决定生死,还是帮助你决定下午点心吃什么?
- 您是这样做一次,还是要开发多个模型?
例如,如果你有一个简单的线性可分问题,训练集很小,那么线性判别解 (Fisher) 最有意义,但如果你有一个复杂的可分边界,训练集很小,那么 LR、SVM 或决策树可能会更好,或者如果您有大量数据,您可以使用神经网络。您还应该考虑要在模型上投入多少时间。一般来说,神经网络是一个相当大的时间投资,但更简单的模型,如 LR 和 KNN 可以在 Excel 中实现。
也就是说,有关数据和应用程序的更多信息可能使我们能够提供更好的建议。
其它你可能感兴趣的问题