我想了解gamma
参数在 SVM 中的作用。根据这个页面。
直观地说,该
gamma
参数定义了单个训练示例的影响范围,低值表示“远”,高值表示“接近”。这些gamma
参数可以看作是模型选择的样本作为支持向量的影响半径的倒数。
我不明白“单个训练示例达到”的这一部分,它是指训练数据集吗?
我想了解gamma
参数在 SVM 中的作用。根据这个页面。
直观地说,该
gamma
参数定义了单个训练示例的影响范围,低值表示“远”,高值表示“接近”。这些gamma
参数可以看作是模型选择的样本作为支持向量的影响半径的倒数。
我不明白“单个训练示例达到”的这一部分,它是指训练数据集吗?
我总结了SVM 的关键思想。所以这就是与高斯内核一起使用:
越大的,决策边界越“线性”。越接近 0,您拥有的支持向量越多/边界越非线性(参见交互式示例)
你也可以在 udacity 上找到它:SVM Gamma Parameter
在实践中,您可以使用网格搜索或随机搜索来获得好的值。
粗略地说,gamma越高,模型越复杂,过拟合的风险就越高。
事实上,正如您在链接的页面上看到的那样:
如果gamma 太大,则支持向量的影响区域半径仅包括支持向量本身[...]
当gamma 非常小时,模型过于受限,无法捕捉数据的复杂性或“形状”。任何选定支持向量的影响区域将包括整个训练集。