我正在寻找 R 中一些可以进行增量学习(也称为在线或顺序学习)的库。与传统批处理方法相比,这种学习的用例是处理大量数据。此类做法包括来自传感器的流和数据,在这些情况下始终使用相同的模型或每次都从头开始重建模型是不可行的。任何只能使用单个新示例来更改模型的机器学习算法就足够了。但是,模型本身不能保留旧数据(您可以想象它很快就会变得太大),而只是计算一些有关数据的统计信息。
对于多元回归,随机梯度下降等在线方法将是一个不错的选择。对于回归/模型树,我会想到类似这篇文章的内容。我正在寻找这样的库,其中可以基于不断发展的模型实现相对良好的预测精度(相对于传统的批处理方法)。