就在我开始这个问题之前,我希望大家知道我已经检查了其他线程以获取变量日志,但我仍然认为我还有一个尚未涉及的问题。我还要感谢 whuber 在这里对另一个日志问题的冗长回答。
这个问题特别涉及我们为什么要记录日志的原因之一,即转换数据的分布。当我们取一个变量的对数时,通常是因为变量的分布是倾斜的,我们希望给它一个正态分布。经济学 OLS 回归中的一个常见示例是表示工资、收入、GDP 等的变量。然而,似乎没有人提到中心极限定理 (CLT)。CLT 说许多随机变量的总和将是正态分布的,即使它们的基础分布不是正态分布的。如果误差是随机变量和的总和, ,那么无论和。如果这成立(并且 CLT 似乎在相当弱的条件下成立)那么我们为什么需要转换变量?

