多类的逻辑回归

机器算法验证 物流 多项分布
2022-03-02 15:40:36

我得到了多类的逻辑回归模型,它由下式给出

P(Y=j|X(i))=exp(θjTX(i))1+m=1kexp(θmTX(i))

其中 k 是类数 theta 是要估计的参数 j 是第 j 个类 Xi 是训练数据

那么我没有得到的一件事是分母部分 是如何 规范化模型的。我的意思是它使概率保持在 0 和 1 之间。

1+m=1kexp(θmTX(i))

我的意思是我习惯了逻辑回归

P(Y=1|X(i))=1/(1+exp(θTX(i)))

实际上,我对规范化的事情感到困惑。在这种情况下,因为它是一个 sigmoid 函数,它永远不会让值小于 0 或大于 1。但我在多类情况下感到困惑。为什么会这样?

这是我的参考https://list.scms.waikato.ac.nz/pipermail/wekalist/2005-February/029738.html我认为应该是标准化

P(Y=j|X(i))=exp(θjTX(i))m=1kexp(θmTX(i))

2个回答

你的公式是错误的(总和的上限)。在具有个类 ( ) 的逻辑回归中,您基本上创建二元逻辑回归模型,您可以在其中选择一个类作为参考或枢轴。通常,选择最后一个类作为参考。因此,参考类的概率可以通过概率的一般形式是由于第类是您的参考因此KK>2K1K

P(yi=K|xi)=1k=1K1P(yi=k|xi).
P(yi=k|xi)=exp(θiTxi)i=1Kexp(θiTxi).
KθK=(0,,0)T
i=1Kexp(θiTxi)=exp(0)+i=1K1exp(θiTxi)=1+i=1K1exp(θiTxi).
最后你得到所有的以下公式: k<K
P(yi=k|xi)=exp(θiTxi)1+i=1K1exp(θiTxi)

我认为你被一个错字弄糊涂了:你的在第一个等式中应该是您在逻辑案例中看到的 1 实际上是,例如,当有 th时。 kk1exp(0)kθ=0

假设现在请注意,您可以从最后一个公式得到逻辑回归版本,如 对于多个类,只需将前两个量中的分母替换为指数线性预测变量的总和即可。 θ1X=b

exp(b)exp(0)+exp(b)=exp(0)exp(0)+exp(b)=11+exp(b)