我正在协助一位同事对由 30 家医院的住院记录组成的数据集中以天为单位测量的平均住院时间 (LOS) 与住院患者入院率的加权回归。我们将每个数据点的权重计算为患者在医院的 LOS 的逆标准误差。
在标准误差 = 0 的情况下,是否有估计逆标准误差权重的标准程序?在几家患者数量较少的医院中,在我们的分析时间段内,所有患者的 LOS 都是相同的,因此标准误差 = 0,产生的权重等于无穷大。
我们可以从回归中删除这些数据点(或完全避免加权回归),但原则上似乎应该有一种可接受的技术在方差 = 0 的特殊情况下计算权重。我没有任何运气检查我的统计教科书。
谢谢你的建议,迈克尔和胡伯。在我运行简单的未加权最小二乘回归(RSS=44.5,ESS=168.9,TSS=213.4)时,大部分总误差平方和可归因于测量误差。
因此,如果我要构建自己的加权方案,它可能需要,在一个极端情况下,如果方差 = 0,那么该医院的权重 = # obs,而在另一个极端情况下,如果方差 = 无穷大,则权重 = 0。
也许一个方便的公式可以是 weight_i = N_i/(N_i^CV_i),其中 weight_i = 医院 i 的体重,N_i = # 医院 i 的 obs,CV_i = 医院 i 观察到的 LOS 的变异系数?