如果标准误差 = 0,则将加权回归的权重计算为 1/(标准误差)

机器算法验证 加权回归
2022-03-25 21:56:19

我正在协助一位同事对由 30 家医院的住院记录组成的数据集中以天为单位测量的平均住院时间 (LOS) 与住院患者入院率的加权回归。我们将每个数据点的权重计算为患者在医院的 LOS 的逆标准误差。

在标准误差 = 0 的情况下,是否有估计逆标准误差权重的标准程序?在几家患者数量较少的医院中,在我们的分析时间段内,所有患者的 LOS 都是相同的,因此标准误差 = 0,产生的权重等于无穷大。

我们可以从回归中删除这些数据点(或完全避免加权回归),但原则上似乎应该有一种可接受的技术在方差 = 0 的特殊情况下计算权重。我没有任何运气检查我的统计教科书。


谢谢你的建议,迈克尔和胡伯。在我运行简单的未加权最小二乘回归(RSS=44.5,ESS=168.9,TSS=213.4)时,大部分总误差平方和可归因于测量误差。

因此,如果我要构建自己的加权方案,它可能需要,在一个极端情况下,如果方差 = 0,那么该医院的权重 = # obs,而在另一个极端情况下,如果方差 = 无穷大,则权重 = 0。

也许一个方便的公式可以是 weight_i = N_i/(N_i^CV_i),其中 weight_i = 医院 i 的体重,N_i = # 医院 i 的 obs,CV_i = 医院 i 观察到的 LOS 的变异系数?

ALOS 与录取率

2个回答

您遇到的问题是您在重量的分母中使用了估计的标准误差。在实际情况下,总体标准差不太可能为 0。当估计的标准误差为 0 时,我认为没有一种标准方法可以应用这种特定的加权方案和其他一些权重。解决方案是采用不同的加权方案。没有法律规定您必须将标准误差的倒数作为权重。在某些假设下,这些将是最佳权重。但这里不是这样。

在其他情况下,当我遇到使我的计算变得困难的棘手零时,例如在我需要反转的矩阵的对角线上,我学到了一些叫做正则化的东西:也就是说,向有问题的变量均匀地添加一个小值。

例如,在我有一个需要求逆的协方差矩阵 Q 的情况下,我将 Qhat = I*q 设置为 q = 10e-x 用于某些 x,对于 I 设置与 Q 大小相同的单位矩阵。在这种情况下,您可以为方差添加一个小值。