一般来说,我在回归中标准化我的自变量,以便正确比较系数(这样它们就有相同的单位:标准差)。但是,对于面板/纵向数据,我不确定我应该如何标准化我的数据,特别是如果我估计一个层次模型。
要了解为什么它可能是一个潜在问题,假设您有个沿个周期测量的个体,并且您测量了一个因变量和一个自变量。如果您运行完整的池化回归,则可以以这种方式标准化您的数据:,因为它不会改变 t-统计。另一方面,如果您拟合一个未合并的回归,即每个人的一个回归,那么您应该仅按个人标准化您的数据,而不是整个数据集(在 R 代码中):
for (i in 1:n) {
for ( t in 1:T) x.z[i] = (x[i,t] - mean(x[i,]))/sd(x[i,])
}
但是,如果您拟合一个简单的分层模型,其中个体截距不同,那么您正在使用收缩估计器,即,您正在估计合并和非合并回归之间的模型。我应该如何标准化我的数据?像汇总回归一样使用整个数据?仅使用个人,例如在未合并的情况下?