尽管 OLS 估计量存在解释问题,但这里的真正问题在于将序数变量视为比率尺度上的变量。通过使用标准线性回归分析,研究人员基本上将序数响应视为一个连续量。通过平均三个评级,他们还隐含地将这些生活满意度测量视为连续聚合测量中相同权重的连续测量。这涉及到许多关于评级量表性质的潜在可疑假设,因此您可以合理地怀疑该衡量标准的合法性。至少,这样的处理掩盖了大量关于解释变量对个体响应测量中的序数类别的具体影响的信息。
在任何情况下,如果我们让表示这种情况下的响应变量(即生活满意度的三个评分的平均值),那么我们有一个如下形式的模型:Y¯
Y¯i=u(β,xi)+εi,
其中真正的回归函数具有线性形式:
u(β,xi)=β0+β1xi,1+⋯+βKxi,k.
像往常一样,每个斜率系数 ( ) 是条件预期响应相对于相应解释变量的变化率:βkk=1,...,K
βk=∂u∂xi,k(β,xi).
如您所见,回归中的系数值着眼于平均生活满意度评级的条件期望值的变化率,您可能认为或可能不认为这是一个可疑的衡量标准。所有个人生活满意度评级都是有序整数值这一事实意味着平均值仅限于支持,因此期望值是这些可能值的凸组合。{1,43,53,⋯,113,4}
关于您的后续问题:(1)对于模型中的真实系数值, OLS 估计量是无偏且一致的(在解释变量的广泛限制条件下),在这种情况下,这可能具有可疑的意义; (2) 响应值的标准化将仅通过线性变换对其进行变换,这将通过相应的线性变换改变所有斜率系数;它不会从根本上改变来自模型的信息。