单变量逻辑回归的“返回值”

机器算法验证 回归 物流 校准
2022-03-25 19:08:51

我阅读了一篇关于校准概率分类器方法的有趣文章(Kull 等人,2017 年,“超越 sigmoid:如何通过 beta 校准从二元分类器中获得良好校准的概率”),并偶然发现了一个我不清楚的公式。

在算法 1 的第二步中,作者写道

(a,c)fitunivariatelogisticregressiontopredictytrainfroms

这让我很困惑。据我了解,这会将逻辑回归拟合的“返回值”分配给变量ac. 虽然作者表示这种获取这两个函数参数的方法使得使用逻辑回归的任何实现成为可能,但这些通常只返回模型对象或模型的系数(应该相等)。

在第 8 页,第 3.1 节,作者介绍了参数a,b,c在命题 1 中,他们表明逻辑模型的似然比等于其使用的 beta 分布的参数化的似然比,这应该表明拟合逻辑模型来获取参数就足够了——但它们似乎并不除了上面的公式写一句话

因此,我们可以使用逻辑校准(即单变量逻辑回归)来拟合 beta[a=b] 校准图,如算法 1 所示。

也许这对于作者来说太微不足道了,无法更明确地写出来,有人可以向我解释一下作者到底分配了什么ac这里?

编辑:为了完整起见,这是论文中算法 1 的屏幕截图 在此处输入图像描述

1个回答

回想一下,逻辑回归是一个预测几率的模型

p(x)1p(x)=eβ0+β1x

现在看看论文中的介词 1 (p 5062)

LRlogistic(lns1s;a,c)=exp[alns1s+c]

看起来算法 1 (p 5063) 是一个“单变量逻辑回归”ytrain作为因变量,s=strain1strain作为自变量,a是斜率和c截距。算法 2中,它是一个“双变量”模型s=lnstrains=ln(1strain)作为特征,作为参数。a,b