逻辑回归问题的决策函数、预测概率和预测函数有什么区别?

机器算法验证 回归 物流 预言 scikit-学习 决定
2022-02-02 08:42:04

我一直在浏览 sklearn 文档,但我无法理解这些函数在逻辑回归上下文中的用途。因为decision_function它说它是超平面和测试实例之间的距离。这些特定信息有何用处?这与predict方法predict-proba有什么关系?

1个回答

回想一下,逻辑回归的函数形式是

f(x)=11+e(β0+β1x1++βkxk)

这就是predict_proba.

指数内的项

d(x)=β0+β1x1++βkxk

是返回的内容decision_function文档中提到的“超平面”是

β0+β1x1++βkxk=0

这个术语是支持向量机的保留,它从字面上估计一个分离的超平面。对于逻辑回归,这个超平面有点像人工构造,它是等概率平面,模型已经确定两个目标类别的可能性相同。

predict函数使用规则返回一个类决策

f(x)>0.5

冒着肥皂盒的风险,该predict功能几乎没有合法用途,我认为在审查其他工作时使用它是错误的标志。我会走得更远,称它为 sklearn 本身的设计错误(该predict_proba函数应该被调用predict,并且predict应该被调用predict_class,如果有的话)。