我一直在对包含多个预测变量的数据集进行建模,但经过广泛的研究,我更加困惑是否应该使用 a lm()
orglm()
函数进行以下操作:
Model4 <-lm(Height_cm ~ Sleep.hours + Gender + Age + Exercise, data=Data.dat.complete)
其中身高是连续的,sleep.hours 是连续的,性别是男性/女性,年龄是连续的,运动是计数的(某人一周锻炼的次数)。
由于我有一个二元变量(性别),我的诊断图看起来不太好,我很想使用glm()
with family=binomial
and link=logit
。然而,在研究了几个小时后,我开始质疑这一点,因为我已经看到使用 just 来拟合性别的例子,lm()
而我的其他预测变量显然不是二元的。
如果可能的话,我想自己尝试至少完成其中的一些工作,但如果有人能指出我正确的方向(即我的理解中的缺陷在哪里),我将不胜感激.
谢谢你。
诊断图: