我正在使用二元结果(开始和不开始)进行逻辑回归。我的预测变量组合都是连续变量或二分变量。
使用 Box-Tidwell 方法,我的一个连续预测变量可能违反了 logit 线性的假设。拟合优度统计数据没有表明拟合存在问题。
我随后再次运行回归模型,将原始连续变量替换为:首先,平方根变换,其次,变量的二分版本。
在检查输出时,拟合优度似乎略有提高,但残差变得有问题。参数估计、标准误差和保持相对相似。根据我的假设,数据的解释在 3 个模型中没有改变。
因此,就我的结果的有用性和数据解释的意义而言,使用原始连续变量报告回归模型似乎是合适的。
我想知道这个:
- 逻辑回归何时对潜在违反 logit 假设的线性具有鲁棒性?
- 鉴于我上面的例子,在模型中包含原始连续变量似乎可以接受吗?
- 是否有任何参考或指南可以推荐何时可以令人满意地接受该模型对可能违反 logit 线性的稳健性?