中值绝对偏差:强制中值为零时的影响/偏差

机器算法验证 疯狂的
2022-04-07 13:50:07

我想估计信号的中值绝对偏差 (MAD)。MAD 定义为信号与其中值之间的绝对差值的中值。

现在我有一个信号,我知道一个事实的中位数为零。它的经验中值当然一般不等于零。

我想知道在目前的情况下(例如,在偏差或精度方面),在将 MAD 估计为信号绝对值的中位数时是否会有任何收益或损失,即通过“强制”经验上述计算中的中位数为零。

1个回答

如果您在没有任何校正的情况下使用样本 MAD 来估计 MAD,那么使用真实中值而不是经验中值将使您的估计偏差更小。

样本 MAD 是对真实 MAD 的偏低估计,因为您实际上正在进行两个估计步骤:

  1. 从数据中估计样本中位数m
  2. 使用相同的数据的绝对偏差m

但是在第 1 步中,您实际上是在选择使第 2 步中的结果最小化因此您的结果最终偏低。这与计算方差时通常将平方和除以而不是的原因相同:它纠正了令人讨厌的参数的偏差mn1n

无论如何,关键是如果你知道真正的中位数,那么你就不会有这个问题,而且你的样本 MAD 是对你的真实 MAD 的无偏估计。因此,您不必担心进行此类更正。

编辑:但是,正如 Glen_b 在评论中指出的那样,如果您对 0 中值的假设甚至有点错误,那么假设 0 中值的估计值将比使用大型数据集的样本中值的估计值差得多。因此,请务必至少检查 0 的真实中位数是否与您的数据一致,即使您知道事实必须如此。

编辑 2:自@AndrewM 提出的更正式的论点:

取一个rv的样本为真实中值,为样本中值。真正的 MAD 是对此的无偏估计是. 定义,因此是真实 MAD 的无偏估计量。那么样本中位数是但是根据中位数 的最优性我们的函数的最小值。因此,除非{Xi}i=1NXmm^EX(|Xm|)1Ni|Xim|mad(y):=1Ni|Xiy|mad(m)mad(m^)m^madm=m^概率为 1,并且样本 MAD 偏低。E(mad(m^))<E(mad(m))