我的问题是,在拟合逻辑回归之前,我们是否需要标准化数据集以确保所有变量在 [0,1] 之间具有相同的尺度。公式为:
我的数据集有 2 个变量,它们对两个通道描述相同的事物,但音量不同。假设是两个商店的客户访问次数,这里是客户是否购买。因为客户在购买之前可以访问这两家商店,或者两次第一家商店,一次第二家商店。但是第一家商店的顾客总访问量是第二家商店的 10 倍。当我拟合这个逻辑回归时,没有标准化, coef(store1)=37, coef(store2)=13
; 如果我标准化数据,那么coef(store1)=133, coef(store2)=11
. 像这样的东西。哪种方法更有意义?
如果我正在拟合决策树模型怎么办?我知道树结构模型不需要标准化,因为模型本身会以某种方式对其进行调整。但是请与大家一起检查。