我一直在课堂上看到这个,我不明白为什么我们不时在其中添加登录。例如,我们有回归模型 1:然后它说我们使用和的对数形式重新估计模型以获得模型 2:是做什么的?在影响回归和影响变量方面。
在回归分析中,取变量的对数有什么作用?
机器算法验证
回归
数据转换
2022-04-04 20:35:14
3个回答
在回归中取变量的对数有两种原因,一种是统计的,一种是实质性的。
从统计上讲,OLS 回归假设由残差估计的误差是正态分布的。当它们正偏斜(长右尾)时,记录日志有时会有所帮助。有时对因变量取对数,有时对一个或多个自变量取对数。
实质上,有时变量变化的意义更多的是乘法而不是加法。例如,收入。如果你每年赚20,000美元,那么5,000美元的加薪是巨大的。如果你一年赚20万美元,那就太少了。记录日志反映了这一点:
log(20,000) = 9.90
log(25,000) = 10.12
log(200,000) = 12.20
log(205,000) = 12.23
间隙为 0.22 和 0.03。
在解释方面,您现在是说对数刻度上的每 1 个单位的变化对 DV 具有相同的影响,而不是原始刻度上的每一个单位的变化。
记录日志将使某些看起来弯曲的关系形式看起来是线性的或更接近线性的。考虑引入新变量和,然后您的模型在和中是线性的。
有时,从主题考虑,这些转变是显而易见的。有时它们只是凭经验选择的。
这是一个老问题,但我过去经常发现自己在寻找这种特定的解释,所以我会在这里添加它。
另一个实质性例子是在计量经济学领域,当使用回归分析来计算弹性(一个变量相对于另一个变量的相对百分比变化)时。在这种情况下,因变量和自变量都经过对数变换的对数对数函数形式非常方便,因为获得的系数直接给出了各自的弹性,而不必取偏导数。对于数学公式,我在这里参考@Charlie 的答案解释对数转换预测器
其它你可能感兴趣的问题