哪些 scikit learn 分类算法接受稀疏矩阵?

数据挖掘 分类 scikit-学习
2021-09-19 23:57:14

如果我必须使用 scikit-learn( sklearn) 库进行分类,并且特征矩阵是稀疏矩阵,那么我可以使用该库的哪些分类算法?

2个回答

这个 kaggle 讨论中,支持稀疏矩阵的分类算法scikit-learn至少是:

  • linear_model.LogisticRegression()
  • svm.SVR()
  • svm.NuSVR()
  • naive_bayes.MultinomialNB()
  • naive_bayes.BernoulliNB()
  • linear_model.PassiveAggressiveClassifier()
  • linear_model.Perceptron()
  • linear_model.Ridge()
  • linear_model.Lasso()
  • linear_model.ElasticNet()
  • linear_model.SGDClassifier()

此外,从这个 quora question中,您可以检查算法的实现是否导入scipy.sparse.csr_matrix

除了 @ncasas 的链接之外,这里是分类/回归/特征选择的完整列表以及 David Ziganto 的博客的更多内容。我上周提到的——

https://dziganto.github.io/Sparse-Matrices-For-Efficient-Machine-Learning/

此外,从 sk-learn 文档中,他们有使用少量模型的文本分类示例代码。

https://scikit-learn.org/0.15/auto_examples/document_classification_20newsgroups.html