有很多方法可以稳健地拟合线性回归模型,例如使用基于 Tukey 的双权重损失或 Huber 的损失的 M 估计,参见例如Wikipedia。
关于上述两个案例,我有两个问题:
- 只要误差分布是对称的,这些对条件响应分布的均值(更准确地说是中心)进行建模是否正确?
- 他们一般在建模什么位置参数?它是响应变量的特殊加权平均值吗?
有很多方法可以稳健地拟合线性回归模型,例如使用基于 Tukey 的双权重损失或 Huber 的损失的 M 估计,参见例如Wikipedia。
关于上述两个案例,我有两个问题:
有很多方法可以稳健地拟合线性回归模型,例如使用基于 Tukey 的双权重损失或 Huber 损失的 M 估计,参见例如 Wikipedia。
只要误差分布是对称的,这些对响应的平均值进行建模是否正确?
嗯,估计,但这可能就是你所说的建模的意思——但前提是平均值存在。但它们将是更普遍的对称中心的合理估计,这将是总体中位数、三平均数和伪中位数,以及任何修剪后的平均值,以及,......通常也是平均值。例如,考虑分布与自由程度。如果没有意思。但它仍然有一个对称中心。
他们一般在建模什么位置参数?
如果损失函数对应于,则 M 估计对应于最大似然估计 对于一些密度. 这是 Huber 损失的情况,但不是 Tukey。
它是响应变量的特殊加权平均值吗?
一般不会*。但是可以通过迭代加权平均来获得 M 估计量**,其中权重在每一步更新。
*(至少不会,除非对“特殊”的解释比人们通常理解的“加权平均”一词能够延伸的范围更广)
**(至少在某些情况下)