我对使用SGDClassifier. 基本上随着更多标记数据的出现而更新模型。我知道我可以使用partial_fit()它。以下似乎是StackOverflow 上的一个常见示例:
clf = linear_model.SGDClassifier()
x1 = some_new_data
y1 = the_labels
clf.partial_fit(x1,y1)
x2 = some_newer_data
y2 = the_labels
clf.partial_fit(x2,y2)
问题是,只partial_fit()执行梯度下降的一步:
在内部,此方法使用
max_iter = 1. 因此,不能保证在调用一次后达到成本函数的最小值。客观收敛、提前停止等事项应由用户自行处理。
一步就够了吗?我怎么知道我是否不需要为每个新标记的数据点/小批量执行更多的步骤?