如果转换后的变量产生更多的正态残差和更少的异方差残差但更低怎么办?R2R2?

机器算法验证 多重回归 数据转换 假设 r平方 残差
2022-04-08 10:42:08

我正在尝试决定是否在多元线性回归中使用平方根转换的因变量。转换会导致更正态分布的残差,也导致更少的异方差。然而,与使用非转换因变量的模型相比,决定系数降低了。y

在决定是否使用转换时,最重要的标准是什么?

编辑(回归的背景和目标):

我有一个大型面板数据集,并且正在运行合并的 OLS 回归。主要目标是发现因变量(电力消耗)与不同的自变量有何不同,所以我主要对实际参数估计感兴趣。

然而,该模型也应该对预测有用,无论是在个人层面还是在聚合层面。在我的上下文中,聚合意味着每天我怀疑使用面板模型对聚合进行建模可能并不完全正确。的反向变换仍然会引起一些头痛......但这可能是另一个问题。yyy

1个回答

简而言之,您不应该仅仅因为它产生更高的价值就使用违反其假设的模型R2. 因此,您应该为模型使用转换后的变量。但是,请记住,平方根是非线性变换。换句话说,如果一条直线在变换之前是最合适的,那么一条直线在变换之后必然不是最合适的。您可能应该添加一个平方项,x2,或类似的东西来补偿转换。很难在抽象中诊断这一点,但是您应该查看数据和模型的图,无论是否经过转换y以确保满足假设并且功能形式是适当的。