对数变换是否总是使分布更接近正态分布?

机器算法验证 分布 正态分布 数据转换 偏度
2022-03-30 09:35:22

我有一个高度右偏的数据集,具有很大范围的值(从 1 ~ 10^6)(由于工作相关原因,无法共享实际数据)。

当我绘制数据的对数时,分布看起来更像正态分布。

我是否偶然发现了对数据集的有意义的见解,或者只是对数变换的一般属性,它使分布更接近正常?

1个回答

对于纯正数,对数变换确实是标准的第一个变换,并且被非常频繁地使用。如果您想要对系数进行乘法解释(例如血液胆固醇加倍/减半),也可以这样做。

当然,它并不总是使分布更正常,例如从 N(1000, 1) 分布中抽取样本:任何转换只能使其不那么正常。