我正在使用scikit-learn 的随机森林来执行一些分类任务,但由于数据量大而内存不足。
是否有随机森林算法(或类似的基于决策树的方法)的小批量实现?
查看 CART 算法。这本质上是一种带有子采样的引导方法,我相信您可以将其推广到批处理。