我想知道在新数据观察上训练 SGDClassier 模型的正确方法是什么?我应该使用fit函数还是partial_fit函数?它们有何不同?
SGDClassifier fit 和 partial_fit 函数
数据挖掘
机器学习
scikit-学习
大数据
算法
2021-10-07 03:13:27
2个回答
fit(),始终像新对象一样初始化参数,并使用传入的数据集fit()方法训练模型。
然而partial_fit(),在初始化参数之上工作,并尝试使用传入的新数据集改进现有权重partial_fit()。
将模型保存在持久存储(比如 pickle 文件)中总是好的,以供以后使用或进一步训练。
我认为这些选项没有“正确的方法”。两者都适合您的数据,但一个会尝试在一个实例中执行此操作 ( fit),而另一个将让您适合部分数据 ( partial_fit)。
在大多数情况下,用户会将他们庞大的数据集划分为更小的“块”,并将这些块按顺序提供给partial_fit,最后一个块的调用partial_fit将返回完整的匹配。
其它你可能感兴趣的问题