在线性回归的情况下,很容易测试连续因变量和每个自变量之间的线性关系。例如,我可以在 Y 轴上的因变量和 X 轴上的一个自变量之间绘制散点图,以在使用线性回归之前可视化关系。
但是,逻辑回归不同,它假设二元因变量和自变量的对数几率之间存在线性关系。我想测试这个假设以确定逻辑回归是否适合我的数据集。我可以测试吗?如何?
此外,R 中是否有任何包可以执行该任务?
在线性回归的情况下,很容易测试连续因变量和每个自变量之间的线性关系。例如,我可以在 Y 轴上的因变量和 X 轴上的一个自变量之间绘制散点图,以在使用线性回归之前可视化关系。
但是,逻辑回归不同,它假设二元因变量和自变量的对数几率之间存在线性关系。我想测试这个假设以确定逻辑回归是否适合我的数据集。我可以测试吗?如何?
此外,R 中是否有任何包可以执行该任务?
好问题。在实践中,很少有人预先测试这个假设,或者完全测试它。为此,您可以将每个自变量 (X) 划分为 8 或 10 或 15 个等区间类别。然后将每个类别中的对数几率计算为 ln(p/[1-p]),其中 p = 因变量 = 1 而不是 0 的案例比例。最后,使用 ANOVA 或非正式地查看散点图评估对数赔率与此 X 之间关系的线性。