我正在做Spark MLlib
一个项目,我必须根据非数字特征对数字数据进行预测。regression algorithm
我对从库中使用哪个感到有点困惑,Spark MLlib
主要是因为这方面的新手。Spark MLlib 库中的算法有:
-linear models (SVMs, logistic regression, linear regression)
-naive Bayes
-decision trees
-ensembles of trees (Random Forests and Gradient-Boosted Trees)
-isotonic regression
谁能给我一些指导,说明哪种算法适合基于非数字特征的数字数据预测?