我有一个带有 13 个特征的葡萄酒数据集,表示 3 个不同的葡萄酒类别(目标),以及 k-NN、带有线性内核的 SVM 和带有 rbf 内核算法的 SVM,可以使用这个数据集进行尝试。
我的目标是获得最好的分类准确率,并获得这个准确率:
我应该选择哪种分类算法(kNN、带线性核的 SVM 或带 rbf 核的 SVM)?
在所有特征中,应该选择哪些特征(基于向后消除,可能根据 p 值)?
我曾想过将 GridSearchCV 与上述算法的 3 个估计器一起使用。但在这种情况下,问题出在您猜测的特征选择部分。是否有任何最佳方式来实现两者?谢谢!