对数转换预测器的解释巧妙地解释了如何log
在 OLS 中解释转换的预测器。如果数据中有 0 并且转换变为log(1 + x)
相反,解释是否会改变?
一些作者(例如 Fox 和 Weisberg 2011)建议如果需要进行变换以纠正偏斜和提高对称性,则添加一个start
(即一个正常数) ,但数据包含零。log
考虑Ornstein
CAR(第 303 页)中示例的变体:
require(car)
data(Ornstein)
boxplot(Ornstein$interlocks, horizontal = T)
数据显然是右偏的,并且包含 0。
summary(powerTransform(1 + Ornstein$interlocks))
## bcPower Transformation to Normality
##
## Est.Power Std.Err. Wald Lower Bound Wald Upper Bound
## 1 + Ornstein$interlocks 0.1248 0.053 0.0209 0.2287
##
## Likelihood ratio tests about transformation parameters
## LRT df pval
## LR test, lambda = (0) 5.502335 1 0.0189911
## LR test, lambda = (1) 262.431991 1 0.0000000
该powerTransform()
函数表明log(1 + x)
此处的转换可能很有用。
boxplot(log(1 + Ornstein$interlocks), horizontal = T)
如您所见,对称性确实得到了改善。
问题:如果这个转换变量作为 IV 包含在 OLS 回归中,系数估计值是否仍然具有log
转换变量的通常解释?