我目前正在研究生阶段参加我的第一个应用线性回归课程,并且正在努力解决多元线性回归中的预测变量转换。我使用的文本,Kutner 等人“应用线性统计模型”似乎没有涵盖我遇到的问题。(除了建议有一种用于转换多个预测变量的 Box-Cox 方法)。
当面对一个响应变量和几个预测变量时,每个预测变量都力求满足什么条件?我知道我们最终是在寻找误差方差和正态分布误差的恒定性(至少在我迄今为止所学过的技术中)。我有很多练习回来了,解决方案在哪里,例如y ~ x1 + (1/x2) + log(x3)
,在哪里一个或多个预测变量被转换。
我理解了简单线性回归下的基本原理,因为很容易查看 y~x1 和相关诊断(残差的 qq 图、残差与 y、残差与 x 等)并测试是否 y~log( x1) 更符合我们的假设。
在存在许多预测变量的情况下,是否有一个好地方可以开始了解何时转换预测变量?
先感谢您。马特