log(1 + x) 转换预测器的解释

机器算法验证 r 回归 数据转换 解释 对数
2022-03-20 07:23:47

对数转换预测器的解释巧妙地解释了如何log在 OLS 中解释转换的预测器。如果数据中有 0 并且转换变为log(1 + x)相反,解释是否会改变?

一些作者(例如 Fox 和 Weisberg 2011)建议如果需要进行变换以纠正偏斜和提高对称性,则添加一个start(即一个正常数) ,但数据包含零。log

考虑OrnsteinCAR(第 303 页)中示例的变体:

require(car)
data(Ornstein)
boxplot(Ornstein$interlocks, horizontal = T) 

在此处输入图像描述

数据显然是右偏的,并且包含 0。

summary(powerTransform(1 + Ornstein$interlocks))
## bcPower Transformation to Normality 
## 
##                         Est.Power Std.Err. Wald Lower Bound Wald Upper Bound
## 1 + Ornstein$interlocks    0.1248    0.053           0.0209           0.2287
## 
## Likelihood ratio tests about transformation parameters
##                              LRT df      pval
## LR test, lambda = (0)   5.502335  1 0.0189911
## LR test, lambda = (1) 262.431991  1 0.0000000

powerTransform()函数表明log(1 + x)此处的转换可能很有用。

boxplot(log(1 + Ornstein$interlocks), horizontal = T)

在此处输入图像描述

如您所见,对称性确实得到了改善。

问题:如果这个转换变量作为 IV 包含在 OLS 回归中,系数估计值是否仍然具有log转换变量的通常解释?

1个回答

这取决于。根据 Wooldridge (2012) 的说法,百分比变化的解释通常被密切保留,除了从开始的变化(未定义百分比变化)。严格地说,只有当上的数据包含相对较少的零时然后将估计值解释为变量为y=0log(1+y)log(y)y