残差图与拟合、线性和异方差

机器算法验证 r 回归 多重回归 数据可视化 线性模型
2022-04-15 08:15:41

我现在正在研究线性回归模型,它具有以下格式:

leisure = ß0 + ß1*age + ß2*log(rain +1) + ß3*log(temperature + 1) + ß4*km + ß5*time

所以基本上我想知道雨和温度是否对一个人花费的休闲活动数量有影响(休闲是一个小数)我在取日志时必须添加一个小常数,因为雨和温度可以取零值。我绘制了残差与拟合图,我想知道我是否以正确的方式解释它。红线几乎是水平的,这应该表明我的自变量和我的因变量休闲之间存在线性关系。然而,该情节也向我展示了异方差性存在巨大问题。我考虑过使用 FGLS 来处理我的异方差。我很感激任何建议和意见。谢谢

在此处输入图像描述

1个回答

由于您的响应变量是计数,因此您需要为计数数据拟合模型,例如泊松或负二项式,例如:

glm(leisure ~ age + rain + temperature + km + time, family = poisson(link = "log", data = mydata) 

它出现在您刚刚使用的残差图中lm

由于您的兴趣在于降雨和温度的影响,如果您认为其中一个的影响因另一个的水平而异,您可能需要考虑它们之间的相互作用。此外,可能会指示非线性关联 - 例如,当天气极冷或极热时,可能会减少一些锻炼。因此,也许二次项或样条曲线是一个好主意。