我对标准化有疑问,我必须使用多元回归,其中一个变量是对数尺度的。是否使用标准化足以重新缩放对数变量,或者是否有必要将转换应用于线性比例然后应用标准化?
对数尺度变量的标准化
数据挖掘
Python
回归
特征缩放
2022-02-13 17:38:43
1个回答
进行特征缩放的方法有很多,很难知道哪一种更好(如果您找到任何关于此的白皮书,请在下面评论)。我会说,如果你有异常值,非线性变换器(如应用日志)是不错的选择,但还有很多其他的(参见这个很棒的sklearn 文档页面)。
关于你的问题,这取决于。您必须进行一些探索性分析来检查变量在每个配置上的分布。如果您发现变量的直方图“足够好”(就定义明确的分布而言——抱歉使用过于笼统的语言),那么请继续使用它而无需进一步标准化。