我确实了解标准化回归预测变量以获得标准化系数的优势,以便更好地解释系数。然而,当我在线阅读多页时,我发现有些人确实将预测变量和结果都标准化以获得标准化系数。这对我来说没有意义。我可以标准化预测变量,但是当结果也标准化时,我们正在预测另一个值(不是实际的 Y)。那正确吗?
当预测变量为标准且结果为中心时,我也接受回归结果。但是,当预测变量是标准的并且结果也是标准的时,不是回归结果。
那是对的吗?
我确实了解标准化回归预测变量以获得标准化系数的优势,以便更好地解释系数。然而,当我在线阅读多页时,我发现有些人确实将预测变量和结果都标准化以获得标准化系数。这对我来说没有意义。我可以标准化预测变量,但是当结果也标准化时,我们正在预测另一个值(不是实际的 Y)。那正确吗?
当预测变量为标准且结果为中心时,我也接受回归结果。但是,当预测变量是标准的并且结果也是标准的时,不是回归结果。
那是对的吗?
不,这并不完全正确。
对于因变量和自变量,关于标准化变量(以及其优缺点)的问题非常相似,但有一个相当可疑的例外:标准化自变量的想法使得比较一个变量与另一个变量的影响变得更加容易。在我看来,这个优势有点虚幻,因为它取决于样本中的数据范围。
尽管这是一个争论的问题,但我通常反对标准化变量。在我看来,变量本身比变量的标准差更容易解释——我们通常对变量本身有一种直观的感觉。
例如,如果我们将体重与身高进行回归,并以磅和英寸(或公斤和厘米,如果你是公制)为单位,那么我们就有了意义:“1 英寸的高度差是相关的2磅的重量差异”(或其他)。
此外,英寸和磅从一个样品到另一个样品保持不变。标准偏差没有。