排除病例后意义发生变化

数据挖掘 逻辑回归
2022-03-15 15:40:51

我有一个县级数据集,其中包含一个二分变量,表示县内是否存在任何特许学校。我正在执行嵌套逻辑回归。该变量是响应,解释变量是社会因素,例如教育水平、家庭语言、家庭类型等。这些状态在响应变量中表示为零)我的结果显示响应和解释变量之间存在显着关联。当我排除这十种状态时,意义就消失了。

关于为什么会发生这种情况的任何想法?

1个回答

听起来你遇到了辛普森悖论粗略地说,您在一组数据中得到了结果,但在查看不同的组或子集时却没有。当变量取决于数据中的隐藏维度时,通常会发生这种情况。

维基百科页面解释得更好,更详细。