我最近一直在处理大型数据集,发现了很多关于流式方法的论文。仅举几例:
- Follow-the-Regularized-Leader and Mirror Descent:等价定理和 L1 正则化 ( http://jmlr.org/proceedings/papers/v15/mcmahan11b/mcmahan11b.pdf )
- 流式学习:一次性 SVM(http://www.umiacs.umd.edu/~hal/docs/daume09onepass.pdf)
- Pegasos:SVM 的原始估计子梯度求解器http://ttic.uchicago.edu/~nati/Publications/PegasosMPB.pdf
- 或在这里:SVM 可以一次做一个流式学习示例吗?
- 流式随机森林 ( http://research.cs.queensu.ca/home/cords2/ideas07.pdf )
但是,我一直找不到任何关于它们如何相互比较的文档。我阅读的每篇文章似乎都在不同的数据集上进行实验。
我知道 sofia-ml、vowpal wabbit,但与现有的大量方法相比,它们似乎实现了很少的方法!
不太常见的算法性能不够吗?是否有任何论文试图审查尽可能多的方法?