我是机器学习的新手,并尝试使用 scikit-learn(sklearn) 来处理分类问题。DecisionTree和SVM都可以针对这个问题训练分类器。
我使用sklearn.ensemble.RandomForestClassifier
andsklearn.svm.SVC
来拟合相同的训练数据(大约 500,000 个条目,每个条目有 50 个特征)。RandomForestClassifier在大约一分钟内就出来了一个分类器。SVC使用超过 24 小时并且仍然保持运行。
为什么SVC的执行效率如此低下?SVC的数据集是否太大?SVC不适合此类问题吗?