机器学习中偏度和数据范围的影响

数据挖掘 特征工程
2022-01-28 16:28:48

我有一个机器学习功能,如下所示,它向左倾斜,并且只有特定数字范围内的数字(这里是 0-2000)。偏度和数字范围会影响学习吗?如果是,我该怎么办?

在此处输入图像描述

1个回答

通常,人们会转换变量。当它严格大于零时,对数变换通常就足够了。如果包括零,就像您的情况一样,一种流行的替代方法是box-cox 变换