我有 12 个积极的训练集(用药物治疗的癌细胞,每种都有 12 种不同的作用机制)。对于这些正训练集中的每一个,我想训练一个支持向量机,以将其与从实验中采样的相同大小的负集区分开来。每组有 1000 到 6000 个细胞,每个细胞有 476 个特征(图像特征),每个都线性缩放到 [0, 1]。
我使用LIBSVM和高斯 RGB 内核。使用五折交叉验证,我对 log₂ C ∈ [-5, 15] 和 log₂ ɣ ∈ [-15, 3] 进行了网格搜索。结果如下:
令我失望的是,没有一组参数可以为所有 12 个分类问题提供高精度。我也很惊讶网格通常不会显示被较低精度包围的高精度区域。这是否只是意味着我需要扩展搜索参数空间,或者网格搜索是否表明其他问题?