在我看来,你在评论中得到了一些非常好的信息。我想知道有关逻辑回归的一些基本事实是否有助于使这些事情更容易理解,所以考虑到这一点,让我陈述几件事。在逻辑回归中,系数在逻辑尺度上(因此得名...)。如果你要插入你的协变量值进行观察,将它们乘以系数,然后将它们相加,你会得到一个logit。
logit=β0+β1x1+β2x2+...+βkxk
logit 是一个对任何人都没有直观意义的数字,因此很难知道如何处理一个看起来很有趣的数字(例如,非常高或非常低)。理解这些东西的最好方法是将它们从原来的尺度(logits)转换成你可以理解的尺度,特别是概率。要做到这一点,你需要你的 logit 并取幂。这意味着您将数字e ( ) 提高到 logit 的幂。想象一下你的 logit 是 2:
这会给你机会。您可以通过将赔率除以一加赔率将赔率转换为概率:
人们通常会发现概率更容易处理。 e≈2.718281828
e2=7.389056
7.3890561+7.389056=0.880797
对于您的模型,假设您有一个观察结果,其中所有变量的值恰好为 0,那么您的所有系数都会丢失,您将只剩下截距值。如果我们将您的值取幂,我们得到 0 作为赔率(如果是 -700,赔率将是,但我无法让我的计算机给我一个 -1060 的值,考虑到我的软件的数值限制,它太小了)。将这些赔率转换为概率, (9.8×10−3050/(1+0)),再次给我们 0。因此,您的输出告诉您的是,当您的所有变量都等于 0 时,您的事件(无论它是什么)根本不会发生。当然,这取决于我们在谈论什么,但我发现没有什么太值得注意的这。标准逻辑回归方程(例如,没有平方项)必然假设协变量与成功概率之间的关系是单调递增或单调递减. 这意味着它总是变得越来越大(或越来越小),因此,如果你在一个方向上走得足够远,你会得到如此小的数字,我的计算机无法将它们与 0 区分开来。这只是野兽的本性。碰巧的是,对于您的模型,要走很远的地方就是您的协变量值等于 0。
至于0的系数,它确实意味着该变量没有影响,正如你所建议的那样。现在,变量不会产生影响是很合理的,但是,您基本上永远不会得到恰好为 0 的系数。我不知道为什么会发生这种情况;评论提供了一些可能的建议。我可以提供另一个,即该变量可能没有变化。例如,如果您有一个编码性别的变量,但您的样本中只有女性。我不知道这是否是真正的答案(例如,RNA
在这种情况下返回,但软件不同)——这只是另一个建议。