我有从 3 个描述符中提取的特征组合。即,基于 GLCM 的特征(相关性、同质性、能量和对比度)、局部二进制模式(256)和离散小波变换系数,以及 40 个案例的数据集。我正在使用带有 RBF 内核的 SVM。
是否需要特征选择?如果是这样,你有什么建议?
我有从 3 个描述符中提取的特征组合。即,基于 GLCM 的特征(相关性、同质性、能量和对比度)、局部二进制模式(256)和离散小波变换系数,以及 40 个案例的数据集。我正在使用带有 RBF 内核的 SVM。
是否需要特征选择?如果是这样,你有什么建议?
我建议“按原样”评估模型的性能,然后决定是否选择特征。
如果您在训练/测试集上都具有良好的性能,则无需执行特征选择。
如果您最终过度拟合您的数据(低训练错误,高测试错误),您可能希望使用特征选择/正则化来减少特征数量(当模型使用大量参数时,成本函数会受到惩罚)
如果你的训练性能低,这意味着你有高偏差(模型不能从这些特征中正确学习)。如果模型不够复杂,无法从数据中提取结构,通常会发生这种情况。在这种情况下,您可能想要添加功能,而不是选择它们。
希望这可以帮助。