我有一个 logit 模型,它在很多情况下都给出了一个介于 0 和 1 之间的数字,但是我们如何解释这个呢?
让我们看一个 logit 为 0.20 的案例
我们能否断言一个案例属于 B 组和 A 组的概率为 20%?
这是解释 logit 值的正确方法吗?
我有一个 logit 模型,它在很多情况下都给出了一个介于 0 和 1 之间的数字,但是我们如何解释这个呢?
让我们看一个 logit 为 0.20 的案例
我们能否断言一个案例属于 B 组和 A 组的概率为 20%?
这是解释 logit 值的正确方法吗?
概率的 logit定义为
术语称为赔率。赔率的自然对数称为对数赔率或logit。
反函数是
概率范围从零到一,即,而 logits 可以是任何实数(,从负无穷大到无穷大;) .
的概率对应于的 logit 。负 logit 值表示概率小于,正 logit 表示概率大于。这种关系是对称的:和的 Logits 分别对应于和的概率。注意:对于这两种概率,的绝对距离是相同的。
该图显示了 logits 和概率之间的非线性关系:
您的问题的答案是:一个案例属于 B 组
要添加更现代(但不是很深)的观点,请考虑它在深度学习中的使用方式(哈,双关语......):
logit 指的是函数(例如神经网络)在归一化之前的输出(我们通常使用 softmax)。这也称为代码。所以如果对于标签我们有分数那么logit是:
在哪里是标准的分区函数。顺便说一句,这在 pytorch 和 tensorflow 文档中到处都是。
因此,您可以将其解释为:
标签的(非标准化)分数或特定类/标签的(功能置信度)。
众多参考资料之一:https ://stackoverflow.com/questions/41455101/what-is-the-meaning-of-the-word-logits-in-tensorflow
您能否指定您的模型并给出输出的屏幕截图,然后我可以给您一个详细的答案,但作为第一次尝试......您可能还想在这些网站上查看以下示例:
http://www.ats.ucla.edu/stat/stata/seminars/stata_logistic/default.htm
http://www.ats.ucla.edu/stat/stata/dae/logit.htm
http://www.ats.ucla.edu/stat/stata/faq/oratio.htm
http://www.ats.ucla.edu/stat/mult_pkg/faq/general/odds_ratio.htm
所以如果系数是 0.2 它取决于变量,我猜你有一个假人,例如 B 组为 0,A 组为 1?
优势比由下式给出:
所以在你的情况下:
这将是您的组变量对应于您的参考组的优势比。