我正在尝试在 100K 行的训练集上运行 libsvm 提供的包装脚本 easy.py,每行有约 300 个特征。特征数据相对稀疏,比如只有 1/10 是非零值。
脚本非常慢,我说的是几天(或更多)。我在 1% 的数据上运行了相同的脚本,它在大约 20 分钟内完成,结果看起来很合理,所以看起来输入数据/格式是正确的,并且没有明显的问题。
我发现 libsvm 的文档有些缺乏,并且对性能等实际问题没有太大帮助。他们的常见问题解答对这些问题保持沉默: http ://www.csie.ntu.edu.tw/~cjlin/libsvm/faq.html
有没有人在 SVM 训练速度方面遇到过类似的问题?您是否知道在这种情况下尝试更合适的库或特定策略?