SGDClassifier fit 和 partial_fit 函数

数据挖掘 机器学习 scikit-学习 大数据 算法
2021-10-07 03:13:27

我想知道在新数据观察上训练 SGDClassier 模型的正确方法是什么?我应该使用fit函数还是partial_fit函数?它们有何不同?

2个回答

fit(),始终像新对象一样初始化参数,并使用传入的数据集fit()方法训练模型。

然而partial_fit(),在初始化参数之上工作,并尝试使用传入的新数据集改进现有权重partial_fit()

将模型保存在持久存储(比如 pickle 文件)中总是好的,以供以后使用或进一步训练。

我认为这些选项没有“正确的方法”。两者都适合您的数据,但一个会尝试在一个实例中执行此操作 ( fit),而另一个将让您适合部分数据 ( partial_fit)。

在大多数情况下,用户会将他们庞大的数据集划分为更小的“块”,并将这些块按顺序提供给partial_fit,最后一个块的调用partial_fit将返回完整的匹配。