机器算法验证 - 支持向量机参数选择 - 吾爱随笔录

支持向量机参数选择

机器算法验证机器学习

2022-03-13 14:47:27

是否有更好的替代方法来选择 C 和 Gamma，从而产生更好的训练性能？

3个回答

网格搜索很慢，因为它会花费大量时间来研究超参数设置，而这些设置并不接近最优。更好的解决方案是Nelder-Mead 单纯形算法，它不需要计算梯度信息，实现起来很简单（维基百科页面上应该有足够的信息）。Weka 工具箱中可能还有一些 java 代码，但是我在 MATLAB 中工作，并没有详细了解 Weka。

SMO 是一种用于查找模型参数而不是超参数的算法。

Nelder-Mead 单纯形法可以涉及与简单网格搜索一样多的函数评估。通常，误差表面足够平滑，接近最优参数值，粗网格搜索然后在较小区域中进行更精细的网格搜索就足够了。

如果您对基于梯度的 C 和 gamma 优化感兴趣，可以使用诸如优化半径-边距边界或优化验证集上的错误率之类的方法。目标函数梯度的计算涉及一个 SVM 训练，但简单的梯度下降可能只涉及几十次迭代。（查看http://olivier.chapelle.cc/ams/获取文章和 Matlab 实现。）

这是Alex Smola 的博客中与您的问题相关的一个条目

这是一个报价：

[...] 从您的数据集中随机挑选 1000 对 (x,x')，计算所有这些对的距离并取中位数、0.1 和 0.9 分位数。现在选择 λ 作为这三个数字中的任何一个的倒数。通过一点交叉验证，您将找出三者中的哪一个是最好的。在大多数情况下，您不需要进一步搜索。

其它你可能感兴趣的问题

上一篇如何通过选票进行选举欺诈？下一篇使用 R lme4 或 nlme 包估计随机效应并应用用户定义的相关/协方差结构