这是关于我的一些同事所遵循的实践或方法的问题。在制作逻辑回归模型时,我看到人们用各自的证据权重 (WoE) 替换分类变量(或分箱的连续变量)。据说这样做是为了在回归变量和因变量之间建立单调关系。现在据我了解,一旦建立模型,方程中的变量就不是数据集中的变量。相反,方程中的变量现在是分离因变量时变量的重要性或权重!
我的问题是:我们现在如何解释模型或模型系数?例如对于以下等式:
我们可以说 是变量增加 1 个单位时奇数比的相对增加 .
但是如果变量被它的 WoE 取代,那么解释将被更改为:变量的重要性/权重增加 1 个单位的奇数比的相对增加
我在互联网上看到过这种做法,但我没有找到这个问题的答案。该社区本身的此链接与某人写道的类似查询有关:
WoE 与作为逻辑回归中的因变量的优势比的自然对数呈线性关系。因此,当我们使用 WoE 而不是变量的实际值时,逻辑回归中不会出现模型错误指定的问题。
但我仍然没有得到解释。请帮助我了解我所缺少的。