我一直在做一些机器学习,并且一直在使用 k 折交叉验证来评估算法的泛化性能。我已经尝试了 k = 5 和 k = 200 的 k 折交叉验证,得到了支持向量机分类的非常不同的结果。
k SVM accuracy
-----------------
5 75%
200 94%
这似乎是由于更改我们为 k 折交叉验证所做的拆分数量而导致的准确性上的巨大差异。这有什么原因吗?我似乎找不到任何关于已经完成调查使用不同 k 值的影响的研究的参考资料。显然,我决定在我的报告中使用哪个 k 值对我的分类器的质量给出了完全不同的印象!