我正在尝试在 scikit-learn 中创建和测试具有各种内核(RBF、Sigmoid、多项式)的非线性 SVM,以创建一个可以对异常和良性行为进行分类的模型。
我的数据集包括 692703 条记录,我使用 75/25% 的训练/测试拆分。此外,我使用了维度在 1 到 14 个特征之间的各种特征组合。然而,各种 SVM 的训练过程花费的时间太长了。这合理吗?
我还通过将参数BaggingClassifier
配置为 ; 结合非线性 SVM检查了集成;然而,训练过程再次进行得太慢了。n_jobs
-1
如何加快培训过程?