我还有 14000 个特征和 500 个训练样本的问题。这是一个二元分类问题,近似椭圆的形式。我使用二次多项式内核和通过 CV 的分类准确度约为 80%。但是,我随机尝试将数据投影到 2-D 上,即我只是挑出两个特征并投影它们,发现有几种组合可以让我 100% 分离。我还使用了 RB 内核,分类准确率约为 70%。有没有人有发生这种情况的原因?
这是我用于 libsvm 的代码...
% train SVM model
model = svmtrain2(Y(train_vec,1),X(train_vec,:),['-t 1 ' '-d 2 ' '-g ' num2str(grid_data(i,1)) ' ' '-r ' num2str(grid_data(i,2)) ' ' '-c ' num2str(C)]);
% test model on test set
[predict_label, accuracy, dec_values] = svmpredict(Y(test_vec,1),X(test_vec,:),model);