我有一个变量 X,其值范围从 -150 到 400。我的训练集中的所有其他变量都是正数,所以我将它们归一化为从 0 到 1,或者它们已经是二进制的,或者它们具有高斯分布,所以我使用标准缩放器。
对于这个带有一些负值的变量 X,我通常将它们标准化为 -1 到 1(由于负值)而不是 0 到 1 是否重要?
我有一个变量 X,其值范围从 -150 到 400。我的训练集中的所有其他变量都是正数,所以我将它们归一化为从 0 到 1,或者它们已经是二进制的,或者它们具有高斯分布,所以我使用标准缩放器。
对于这个带有一些负值的变量 X,我通常将它们标准化为 -1 到 1(由于负值)而不是 0 到 1 是否重要?
在我看来,这取决于负号含义的重要性。
如果值的符号表示值的方向,那么保留负号会更好。例如,+1 表示向右移动,-1 表示向左移动。
另一方面,如果负号仅表示小于0,则可以将它们归一化为0到1。例如可变记录温度,负值仅表示小于正值。