如果我必须使用 scikit-learn( sklearn
) 库进行分类,并且特征矩阵是稀疏矩阵,那么我可以使用该库的哪些分类算法?
哪些 scikit learn 分类算法接受稀疏矩阵?
数据挖掘
分类
scikit-学习
2021-09-19 23:57:14
2个回答
从这个 kaggle 讨论中,支持稀疏矩阵的分类算法scikit-learn
至少是:
linear_model.LogisticRegression()
svm.SVR()
svm.NuSVR()
naive_bayes.MultinomialNB()
naive_bayes.BernoulliNB()
linear_model.PassiveAggressiveClassifier()
linear_model.Perceptron()
linear_model.Ridge()
linear_model.Lasso()
linear_model.ElasticNet()
linear_model.SGDClassifier()
此外,从这个 quora question中,您可以检查算法的实现是否导入scipy.sparse.csr_matrix
。
除了 @ncasas 的链接之外,这里是分类/回归/特征选择的完整列表以及 David Ziganto 的博客的更多内容。我上周提到的——
https://dziganto.github.io/Sparse-Matrices-For-Efficient-Machine-Learning/
此外,从 sk-learn 文档中,他们有使用少量模型的文本分类示例代码。
https://scikit-learn.org/0.15/auto_examples/document_classification_20newsgroups.html
其它你可能感兴趣的问题