我正在尝试使用 50 个连续解释变量来预测二元结果(大多数变量的范围是到)。我的数据集有近 24,000 行。当我在 R 中运行时,我得到:glm
Warning messages:
1: glm.fit: algorithm did not converge
2: glm.fit: fitted probabilities numerically 0 or 1 occurred
我已经阅读了其他建议可能会发生完美分离的回复,但我确信我的数据中并非如此(尽管可能存在准完全分离;我如何测试以查看是否是这种情况?) . 如果我删除一些变量,“没有收敛”错误可能会消失。但情况并非总是如此。
我尝试在bayesglm
函数中使用相同的变量并得到相同的错误。
你会采取什么步骤来弄清楚这里到底发生了什么?您如何找出导致问题的变量?