机器算法验证 - R 中的逻辑回归导致完美分离（Hauck-Donner 现象）。怎么办？ - 吾爱随笔录

我正在尝试使用 50 个连续解释变量来预测二元结果（大多数变量的范围是到）。我的数据集有近 24,000 行。当我在 R 中运行时，我得到： $-\infty$ $\infty$ glm

Warning messages:  
1: glm.fit: algorithm did not converge  
2: glm.fit: fitted probabilities numerically 0 or 1 occurred

我已经阅读了其他建议可能会发生完美分离的回复，但我确信我的数据中并非如此（尽管可能存在准完全分离；我如何测试以查看是否是这种情况？） . 如果我删除一些变量，“没有收敛”错误可能会消失。但情况并非总是如此。

我尝试在bayesglm函数中使用相同的变量并得到相同的错误。

你会采取什么步骤来弄清楚这里到底发生了什么？您如何找出导致问题的变量？