拟合优度差的逻辑回归(hosmer lemeshow)?

机器算法验证 回归 物流 多重共线性 r平方
2022-04-16 01:17:39

我建立了一个包含 9 个分类预测变量的模型。使用 SPSS,我的综合检验显着 ( =220.01),我的 -2loglikelihood 为 1335.2 (Nagelkerke 0.231),但我的 Hosmer 和 Lemeshow 检验显着 (chi-sqr=16.2, p=0.042)。我的样本量是 n=1199。χ2R2

尽管缺乏拟合,但继续使用此模型是否有问题?

我尝试删除我的一个二元预测变量,并注意到在新模型中我的 Hosmer Lemeshow 测试很显着(p=0.198),但我的 -2loglikelihood 增加到 1442.2。Hosmer Lemeshow 和 -2loglikelihood 之间是否存在权衡?

我如何决定哪种模型是合适的?

我建立这个模型的方法最初是输入我所有感兴趣的预测变量,并检查我感兴趣的变量的调整后的 OR。我的模型不合适吗?

此外,当您的预测变量都是分类变量(在其他顺序中,无法计算 VIF)时,如何测试多重共线性。我在课堂上被告知,只要 Beta 系数的标准误差小于 2,就没有理由怀疑多重共线性,但我不确定这是否足够?

1个回答

正如本网站其他地方所讨论的,Hosmer 和 Lemeshow 测试已过时。另见Logistic 回归中的拟合优度检验;我们要测试哪个“适合”?.

我在https://hbiostat.org/rms上的回归建模策略课程笔记为逻辑回归模型规范和验证提供了一个有希望的连贯策略。我们几乎从不想为了让模型有更好的校准曲线而牺牲预测歧视。

请注意,如果模型仅包含分类变量并且不需要变量之间的交互作用,则模型必须拟合数据并且不需要校准评估。

为了检查共线性,我建议使用变量聚类,例如 RHmiscvarclus函数。